Tabela de métodos para Classificação Random Forests®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Encontre definições e orientações de interpretação para a tabela Método.

Validação do modelo

Classificação Random Forests® usa validação com dados usando método out-of-bag para cada análise. Se você selecionar validação com um conjunto de teste, além da validação com dados usando método out-of-bag, então a tabela exibirá a coluna que identifica o conjunto de teste ou a porcentagem dos dados nos conjuntos de teste e treinamento.

Número de amostras por bootstrap

O número de amostras por bootstrap indica o número de árvores na análise. Quando você usa a única validação com dados usando método out-of-bag, o tamanho da amostra é o mesmo que o número de linhas na análise. Quando você usa validação com um conjunto de teste, o tamanho padrão da amostra é o mesmo que o tamanho dos dados de treinamento. Se você optar por usar um tamanho amostral menor do que o tamanho dos dados de treinamento, a tabela exibirá esse tamanho.

Número de preditores selecionados para divisão de nó

Esta linha indica se a divisão do nó considera cada preditor em cada nó ou um subconjunto aleatório dos preditores. Se a divisão do nó usar um subconjunto aleatório, esta linha indica a escolha para o número de preditores a serem considerados.

Se você usar todos os preditores inicialmente, considere se deve usar um subconjunto de preditores nos modelos subsequentes para comparar o desempenho dos modelos.

Tamanho mínimo do nó interno

O tamanho mínimo do nó interno indica o número mínimo de casos que um nó pode ter e ainda se dividir em mais nós. Se o desempenho do modelo for inadequado, pondere sobre aumentar esse valor para ver o efeito sobre o desempenho.

Penalidade de valor faltante

Por padrão, a análise não tem uma penalidade de valor faltante e esta linha não está presente. A penalidade de valor faltante penaliza uma variável preditora com base na proporção de valores faltantes. Uma variável com uma penalidade alta é menos propensa a se tornar o divisor de um nó.

Penalidade de categoria de nível superior

Por padrão, a análise não tem uma penalidade de categoria de alto nível e esta linha não está presente. A penalidade de categoria de nível superior penaliza a variável com base no número de níveis categóricos em relação ao tamanho do nó para cada nó. Assim, um concorrente com muitos níveis em um nó tem menos probabilidade de se tornar o divisor desse nó.

Linhas utilizadas

O número de observações de resposta que estão na análise.

Linhas não utilizadas

O número de observações de resposta faltantes.