Se você adicionar validação com um conjunto de teste à validação com dados usando método out-of-bag, então a tabela incluirá estatísticas separadas para o conjunto de treinamento e o conjunto de teste.
A tabela inclui esta estatística quando você adiciona validação com um conjunto de teste. Os números representam quantos valores de resposta não ausentes estão nos conjuntos de teste e treinamento.
A tabela inclui esta estatística quando você adiciona validação com um conjunto de teste. Os números representam a porcentagem de observações que estão no conjunto de dados de treinamento e no conjunto de dados de teste.
Uma medida tipicamente utilizada do centro de um grupo de números. A média é também chamada de a média. Ela é a soma de todas as observações dividida pelo número de observações (não faltantes).
Termo | Descrição |
---|---|
observação | |
média das observações | |
N | número de observações não faltantes |
O menor valor no conjunto de dados.
25% das suas observações da amostra são menores ou iguais ao valor do 1o quartil. Portanto, o terceiro quartil também é conhecido como o 25o percentil.
A mediana da amostra fica no meio dos dados: pelo menos metade das observações são menores ou iguais a ela, e pelo menos metade são maiores ou iguais a ela.
Suponha que você tenha um conjunto de dados que contenha N valores. Para calcular a mediana, primeiro ordene seus valores de dados dos menores para os maiores. Se N for ímpar, a mediana da amostra será o valor do meio. Se N for par, a mediana da amostra será a média dos dois valores do meio.
75% das suas observações da amostra são menores ou iguais ao valor do terceiro quartil. Portanto, o terceiro quartil também é conhecido como o 75o percentil.
O maior valor em seu conjunto de dados.