Tabela Sumário do modelo para Classificação CART®

Encontre definições e orientações de interpretação para a tabela Sumário do Modelo.
Observação

O Minitab exibe resultados ambos os conjuntos de dados: de treinamento e de teste. Os resultados dos testes indicam se o modelo consegue predizer adequadamente os valores de resposta para novas observações, ou resumir adequadamente as relações entre a resposta e as variáveis preditoras. Os resultados de treinamento geralmente são mais ideais do que os reais e servem apenas como referência.

Clique em Selecionar uma árvore alternativa para abrir um gráfico interativo que inclui uma tabela de estatística de sumário do modelo. Use o gráfico para investigar árvores menores com desempenho semelhante.

Normalmente, uma árvore com menos nós terminais proporciona uma visão mais clara de como cada variável preditora afeta os valores de resposta. Uma árvore menor também facilita a identificação de alguns grupos-alvo para a realização de estudos adicionais. Se a diferença na exatidão da predição para uma árvore menor for insignificante, você pode usar a árvore menor para avaliar as relações entre a resposta e as variáveis preditoras.

Preditores totais

O número de preditores totais disponíveis para a árvore de classificação. Esta é a soma dos preditores contínuos e categóricos especificados por você.

Preditores importantes

O número de preditores importantes na árvore de classificação. Os preditores importantes são as variáveis usadas como divisores primários ou substitutos.

Interpretação

Você pode usar o gráfico de Importância Relativa da Variável para exibir a ordem de importância relativa da variável. Por exemplo, suponha que 10 dos 20 preditores sejam importantes na árvore de classificação, o gráfico de Importância Relativa da Variável exibe as variáveis em ordem de importância.

Número de nós terminais

Um nó terminal é um nó final que não pode continuar a ser dividido.

Interpretação

Os nós terminais são os grupos finais mais puros identificados pelo método da árvore de classificação. Você pode usar as informações dos nós terminais para fazer predições.

Tamanho mínimo do nó terminal

O tamanho mínimo do nó terminal é o nó terminal com o menor número de casos.

Interpretação

Por padrão, o Minitab define como 3 o número mínimo de casos permitidos para um nó terminal; no entanto, sua árvore pode ter tamanhos mínimos de nó terminal maior que 3. Você também pode alterar esse valor de limite na subcaixa de diálogo Opções.

Média − Log-verossimilhança

O Minitab calcula a média da função de log-verossimilhança negativa quando a resposta é binária.

Interpretação

Compare os valores médios do log-verossimilhança para teste provenientes de diferentes modelos para determinar o modelo com o melhor ajuste. A menor média do valor do log-verossimilhança indica um ajuste melhor.

Área sob a curva ROC

A curva ROC traça a taxa de positivos verdadeiros (TPR), também conhecida como poder, no eixo y. A curva ROC traça a taxa de falsos positivos (FPR), também conhecida como erro tipo 1, no eixo x. A área sob uma curva ROC indica se a árvore de classificação é um bom classificador.

Interpretação

Para árvores de classificação, a área sob os valores da curva ROC variam de 0,5 a 1. Quando uma árvore de classificação pode separar perfeitamente as classes, a área sob a curva é 1. Quando a árvore de classificação não pode separar as classes melhor do que uma atribuição aleatória, então a área sob a curva é de 0,5.

Ganho

O Minitab exibe o ganho quando a resposta é binária. O ganho é o ganho acumulado para os 10% dos dados com a melhor chance de classificação correta.

Interpretação

O ganho representa a razão da resposta-alvo dividida pela resposta média. Quando o ganho é maior que 1, um segmento dos dados tem uma resposta maior do que o esperado.

Custo de classificação errada

O custo de classificação errada é o custo relativo da classificação errada. O custo é relativo a uma árvore que prediz o resultado mais comum para cada caso. O custo relativo é responsável pela taxa de erros e pelo custo ponderado.

Interpretação

O custo da classificação errada sob Teste representa o custo de classificação errada que ocorre em todos os níveis quando o Minitab usa a árvore nos resultados em vez de outra árvore para predizer os valores de resposta para novas observações. Valores menores indicam que a árvore nos resultados apresentam melhor desempenho. Valores inferiores a 1 indicam que o modelo nos resultados custa menos do que um modelo que prediz o resultado mais comum para cada caso.