Eficácia da classificação dos melhores e piores nós terminais Classificação CART®

Use a estatística de eficácia de classificação para caracterizar os nós de interesse especial em razão de seu desempenho.

O Minitab exibe uma tabela para cada nível de resposta. Cada linha da tabela mostra o resumo de um nó. Tanto para casos binários quanto multinomiais, o Minitab classifica as probabilidades de classe usando a expressão, Abs (probabilidade de evento – 0,5). Quanto maior o valor, melhor é o nó terminal. Os melhores nós estão ordenados do melhor para o pior. Os piores nós estão ordenados do pior para o melhor.

Se houver algum empate ao usar as probabilidades de classe, o Minitab usará o % de N como a segunda classificação. O nó terminal com o maior % de N é o primeiro. Se ainda houver algum empate após essa classificação, o Minitab exibe o menor nó terminal primeiro nos cenários "Melhor", "Pior" e "Melhor e Pior".
Observação

Mesmo na ordenação de nó "Pior", o desempate deve mostrar o maior % de N primeiro, assim as ordenações de "Melhor" e "Pior" nem sempre serão opostas uma da outra.

Quando você usa um conjunto de dados de teste, o Minitab calcula a estatística separada para os dados de treinamento e de teste. Você pode comparar a estatística para examinar o desempenho relativo da árvore nos dados de treinamento e em novos dados. Normalmente, a estatística de teste é uma medida melhor do desempenho da árvore para novos dados. Os nós terminais para Treinamento e Teste são classificados separadamente com base na probabilidade de evento de cada um. Os nós terminais que não possuem observações para os dados de Teste não têm probabilidades de evento, portanto, esses nós não são considerados.

Nó terminal
A identificação do nó terminal.
Contagem de eventos ou contagem de classes
A contagem é o número de casos no nó para evento ou não evento, ou para a classe. Se a análise inclui pesos, ela é chamada de contagem ponderada. Os nós terminais com muitos casos podem ser de interesse especial porque esses nós normalmente representam casos mais comuns.
Contagem total
A contagem total é o total de casos de evento e não evento ou o total de todas as contagens de classe.
% de N
A porcentagem dos dados no nó.
Probabilidade de eventos ou probabilidade de classe
A probabilidade de evento é usada em variáveis resposta binária e a probabilidade de classe é usada variáveis resposta multinomiais.
Probabilidade de não evento ou probabilidade de não classe
A probabilidade de não evento é usada em variáveis resposta binárias e a probabilidade não classe é usada em variáveis de resposta multinomiais.
Chances
As chances indicam a razão da probabilidade do evento para o não evento ou da classe para a não classe.