Validação do modelo

Regressão Random Forests® usa validação fora da sacola para cada análise. Se você selecionar validação com um conjunto de teste, além da validação fora da sacola, então a tabela exibirá a coluna que identifica o conjunto de teste ou a porcentagem dos dados nos conjuntos de teste e treinamento.

Número de amostras por bootstrap

O número de amostras por bootstrap indica o número de árvores na análise. Quando você usa a única validação fora da sacola, o tamanho da amostra é o mesmo que o número de linhas na análise. Quando você usa validação com um conjunto de teste, o tamanho padrão da amostra é o mesmo que o tamanho dos dados de treinamento. Se você optar por usar um tamanho amostral menor do que o tamanho dos dados de treinamento, a tabela exibirá esse tamanho.

Número de preditores selecionados para divisão de nó

Esta linha indica se a divisão do nó considera cada preditor em cada nó ou um subconjunto aleatório dos preditores. Se a divisão do nó usar um subconjunto aleatório, esta linha indica a escolha para o número de preditores a serem considerados.

Se você usar todos os preditores inicialmente, considere se deve usar um subconjunto de preditores nos modelos subsequentes para comparar o desempenho dos modelos.

Tamanho mínimo do nó interno

O tamanho mínimo do nó interno indica o número mínimo de casos que um nó pode ter e ainda se dividir em mais nós. Se o desempenho do modelo for inadequado, pondere sobre aumentar esse valor para ver o efeito sobre o desempenho.

Penalidade de valor faltante

Por padrão, a análise não tem uma penalidade de valor faltante e esta linha não está presente. A penalidade de valor faltante penaliza uma variável preditora com base na proporção de valores faltantes. Uma variável com uma penalidade alta é menos propensa a se tornar o divisor de um nó.

Penalidade de categoria de nível superior

Por padrão, a análise não tem uma penalidade de categoria de alto nível e esta linha não está presente. A penalidade de categoria de nível superior penaliza a variável com base no número de níveis categóricos em relação ao tamanho do nó para cada nó. Assim, um concorrente com muitos níveis em um nó tem menos probabilidade de se tornar o divisor desse nó.

Linhas usadas

O número de observações de resposta presentes na análise que ajusta e avalia o modelo.

Linhas não utilizadas

O número de observações de resposta faltantes.

Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política