Tabela Sumário do modelo para Classificação Random Forests®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Encontre definições e orientações de interpretação para a tabela Sumário do Modelo. Se você adicionar validação com um conjunto de teste para validação com os dados out-of-bag, então o Minitab exibirá resultados para ambos os métodos de validação.

Preditores totais

O número de preditores totais disponíveis para a modelo de Random Forests®. O total é a soma dos preditores contínuos e categóricos especificados por você.

Preditores importantes

O número de preditores importantes no modelo de Random Forests®. Os preditores importantes têm pontuações de importância maiores que 0. Você pode usar a carta de Importância Relativa da Variável para exibir a ordem de importância relativa da variável. Por exemplo, suponha que 10 dos 20 preditores sejam importantes no modelo, a carta de Importância Relativa da Variável exibe as variáveis em ordem de importância.

Média − Log-verossimilhança

O Minitab calcula a média de log-verossimilhança negativa quando a resposta é binária. Compare os valores médios do log-verossimilhança provenientes de diferentes modelos para determinar o modelo com o melhor ajuste. Você também pode usar essa estatística para comparar modelos de outros comandos, como Classificação CART® e Classificação TreeNet®. Uma média menor – valores de log-verossimilhança indica um ajuste melhor.

Área sob a curva ROC

A curva ROC traça a taxa de positivos verdadeiros (TPR), também conhecida como poder, no eixo y. A curva ROC traça a taxa de falsos positivos (FPR), também conhecida como erro tipo 1, no eixo x. A área sob uma curva ROC indica se a árvore de classificação é um bom classificador.

Para árvores de classificação, a área sob os valores da curva ROC variam tipicamente de 0,5 a 1. Os valores maiores indicam um modelo de ajuste melhor. Quando o modelo consegue separar perfeitamente as classes, a área sob a curva é 1. Quando o modelo não consegue separar as classes melhor do que uma atribuição aleatória, a área sob a curva é 0,5.

Ganho

O Minitab exibe o ganho quando a resposta é binária. O ganho é o ganho acumulado para os 10% dos dados com a melhor chance de classificação correta.

O ganho representa a razão da resposta-alvo dividida pela resposta média. Quando o ganho é maior que 1, um segmento dos dados tem uma resposta maior do que o esperado.

Taxa de classificação errada

A taxa de classificação errada indica com que frequência o modelo classifica com exatidão os eventos e os não eventos. Valores menores indicam melhor desempenho.