Tabela sumário do modelo para Ajuste de modelo e Descubrir preditores-chave com Classificação TreeNet®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Encontre definições e orientações de interpretação para a tabela Sumário do Modelo.
Observação

O Minitab exibe resultados ambos os conjuntos de dados: de treinamento e de teste. Os resultados dos testes indicam se o modelo consegue predizer adequadamente os valores de resposta para novas observações, ou resumir adequadamente as relações entre a resposta e as variáveis preditoras. Use os resultados do treinamento para avaliar o sobreajuste do modelo.

Preditores totais

O número de preditores totais disponíveis para a modelo do TreeNet®. O total é a soma dos preditores contínuos e categóricos especificados por você.

Preditores importantes

O número de preditores importantes no modelo do TreeNet®. Os preditores importantes têm pontuações de importância maiores que 0. Você pode usar a carta de Importância Relativa da Variável para exibir a ordem de importância relativa da variável. Por exemplo, suponha que 10 dos 20 preditores sejam importantes no modelo, a carta de Importância Relativa da Variável exibe as variáveis em ordem de importância.

Número de árvores cultivadas

Por padrão, o Minitab cultiva 300 árvores CART® pequenas para produzir o modelo do TreeNet®. Embora esse valor funcione bem para a exploração dos dados, considere se deve cultivar mais árvores para produzir um modelo final. Para alterar o número de árvores cultivadas, vá para a subcaixa de diálogo Opções.

Número ótimo de árvores

O número ótimo de árvores corresponde ao menor valor do log-verossimilhança negativo médio ou taxa de classificação errada, ou o maior valor da área sob a curva ROC.

Quando o número ótimo de árvores está próximo do número máximo de árvores cultivadas pelo modelo, considere uma análise com mais árvores. Assim, se você cultivar 300 árvores e o número ótimo voltar como 298, recrie o modelo com mais árvores. Se o número ótimo continuar próximo ao número máximo, continue aumentando o número de árvores.

Média − Log-verossimilhança

O Minitab calcula a média da função de log-verossimilhança negativa quando a resposta é binária. Compare os valores médios do log-verossimilhança para teste provenientes de diferentes modelos para determinar o modelo com o melhor ajuste. Uma média menor – o log-verossimilhança indica um ajuste melhor.

Área sob a curva ROC

A curva ROC traça a taxa de positivos verdadeiros (TPR), também conhecida como poder, no eixo y. A curva ROC traça a taxa de falsos positivos (FPR), também conhecida como erro tipo 1, no eixo x. A área sob uma curva ROC indica se o modelo é um bom classificador.

Para árvores de classificação, a área sob os valores da curva ROC variam tipicamente de 0,5 a 1. Os valores maiores indicam um modelo de ajuste melhor. Quando o modelo consegue separar perfeitamente as classes, a área sob a curva é 1. Quando o modelo não consegue separar as classes melhor do que uma atribuição aleatória, a área sob a curva é 0,5.

Ganho

O Minitab exibe o ganho quando a resposta é binária. O ganho é o ganho acumulado para os 10% dos dados com a melhor chance de classificação correta.

O ganho representa a razão da resposta-alvo dividida pela resposta média. Quando o ganho é maior que 1, um segmento dos dados tem uma resposta maior do que o esperado.

Taxa de classificação errada

A taxa de classificação errada ótima ocorre na árvore com a área ótima sob a curva ROC. A taxa de classificação errada indica com que frequência o modelo classifica com exatidão os eventos e os não eventos.

Valores menores indicam melhor desempenho.