O Minitab exibe resultados ambos os conjuntos de dados: de treinamento e de teste. Os resultados dos testes indicam se o modelo consegue predizer adequadamente os valores de resposta para novas observações, ou resumir adequadamente as relações entre a resposta e as variáveis preditoras. Os resultados de treinamento geralmente são mais ideais do que os reais e servem apenas como referência.
Clique em Selecionar uma árvore alternativa para abrir um gráfico interativo que inclui uma tabela de estatística de sumário do modelo. Use o gráfico para investigar árvores menores com desempenho semelhante.
Normalmente, uma árvore com menos nós terminais proporciona uma visão mais clara de como cada variável preditora afeta os valores de resposta. Uma árvore menor também facilita a identificação de alguns grupos-alvo para a realização de estudos adicionais. Se a diferença na exatidão da predição para uma árvore menor for insignificante, você pode usar a árvore menor para avaliar as relações entre a resposta e as variáveis preditoras.
O número de preditores totais disponíveis para a árvore de classificação. Esta é a soma dos preditores contínuos e categóricos especificados por você.
O número de preditores importantes na árvore de classificação. Os preditores importantes são as variáveis usadas como divisores primários ou substitutos.
Você pode usar o gráfico de Importância Relativa da Variável para exibir a ordem de importância relativa da variável. Por exemplo, suponha que 10 dos 20 preditores sejam importantes na árvore de classificação, o gráfico de Importância Relativa da Variável exibe as variáveis em ordem de importância.
Um nó terminal é um nó final que não pode continuar a ser dividido.
Os nós terminais são os grupos finais mais puros identificados pelo método da árvore de classificação. Você pode usar as informações dos nós terminais para fazer predições.
O tamanho mínimo do nó terminal é o nó terminal com o menor número de casos.
Por padrão, o Minitab define como 3 o número mínimo de casos permitidos para um nó terminal; no entanto, sua árvore pode ter tamanhos mínimos de nó terminal maior que 3. Você também pode alterar esse valor de limite na subcaixa de diálogo Opções.
O Minitab calcula a média da função de log-verossimilhança negativa quando a resposta é binária.
Compare os valores médios do log-verossimilhança para teste provenientes de diferentes modelos para determinar o modelo com o melhor ajuste. A menor média do valor do log-verossimilhança indica um ajuste melhor.
A curva ROC traça a taxa de positivos verdadeiros (TPR), também conhecida como poder, no eixo y. A curva ROC traça a taxa de falsos positivos (FPR), também conhecida como erro tipo 1, no eixo x. A área sob uma curva ROC indica se a árvore de classificação é um bom classificador.
Para árvores de classificação, a área sob os valores da curva ROC variam de 0,5 a 1. Quando uma árvore de classificação pode separar perfeitamente as classes, a área sob a curva é 1. Quando a árvore de classificação não pode separar as classes melhor do que uma atribuição aleatória, então a área sob a curva é de 0,5.
O Minitab exibe o ganho quando a resposta é binária. O ganho é o ganho acumulado para os 10% dos dados com a melhor chance de classificação correta.
O ganho representa a razão da resposta-alvo dividida pela resposta média. Quando o ganho é maior que 1, um segmento dos dados tem uma resposta maior do que o esperado.
O custo de classificação errada é o custo relativo da classificação errada. O custo é relativo a uma árvore que prediz o resultado mais comum para cada caso. O custo relativo é responsável pela taxa de erros e pelo custo ponderado.
O custo da classificação errada sob Teste representa o custo de classificação errada que ocorre em todos os níveis quando o Minitab usa a árvore nos resultados em vez de outra árvore para predizer os valores de resposta para novas observações. Valores menores indicam que a árvore nos resultados apresentam melhor desempenho. Valores inferiores a 1 indicam que o modelo nos resultados custa menos do que um modelo que prediz o resultado mais comum para cada caso.