Especifique as configurações padrão para Classificação CART®

Arquivo > Opções > Análise preditiva > Classificação CART®

Especifique os métodos padrão para classificar árvores. As alterações feitas para os padrões permanecem até serem alterados novamente, mesmo depois que você sair do Minitab.

Método de divisão de nós
Escolha o método de divisão para gerar sua árvore de decisão. Você pode comparar os resultados de vários métodos de divisão para determinar a melhor escolha para sua aplicação.
  • : O método Gini é o método padrão. O método Gini funciona bem em muitas aplicações. O método Gini geralmente gera árvores que incluem pequenos nódulos com alta concentração da resposta de interesse.
  • : O método entropia é proporcional ao máximo de certas funções de probabilidade para o nó.
  • : O método Twoing só está disponível com uma resposta multinomial. O método Twoing geralmente gera divisões mais equilibradas do que os métodos Gini ou Entropia. Para uma resposta binária, o método Twoing é o mesmo que o método Gini.
  • : A árvore de probabilidade tende a ser maior que a árvore de Gini. Use o método de probabilidade quando estiver interessado no desempenho de alguns nós superiores.
Critério para seleção da árvore ótima
Escolha entre os seguintes critérios para selecionar a árvore nos resultados. Você pode comparar os resultados de diferentes árvores para determinar a melhor escolha para sua aplicação.
  • : Selecione esta opção para exibir resultados para a árvore que minimiza o custo de má classificação.
  • : Selecione esta opção para exibir resultados para a menor árvore com um custo de classificação invisionrado dentro de erros padrão K do custo mínimo de classificação. Por padrão, K=1, então os resultados são para a menor árvore com um custo de classificação errada dentro de 1 erro padrão da árvore com o custo mínimo de má classificação.
Número mínimo de casos para dividir um nó interno
Digite um valor para representar o número mínimo de casos um nó interno a ser dividido. O padrão é 10. Com tamanhos de amostra maiores, você pode querer aumentar este mínimo. Por exemplo, se um nó interno tiver 10 ou mais casos, o Minitab tentará executar uma divisão. Se o nó interno tiver 9 casos ou menos, o Minitab não tentará realizar uma divisão.
O limite do nó interno deve ser pelo menos o dobro do limite do nó terminal, mas as proporções maiores são melhores. Os limites do nó interno de pelo menos 3 vezes os limites do nó terminal permitem um número razoável de divisores.
O valor padrão é 10.
Número mínimo de casos permitidos para um nó terminal
Digite um valor para representar o número mínimo de casos que podem ser separados em um nó terminal. O padrão é 3. Com tamanhos de amostra maiores, você pode querer aumentar este mínimo. Por exemplo, se uma divisão criar um nó com menos de 3 casos, o Minitab não executará uma divisão.
O valor padrão é 3.
Penalidade de valor perdido
Digite um valor de penalidade para um preditor com valores perdidos. Como é mais fácil ser um bom divisor com menos dados, preditores com dados ausentes têm uma vantagem sobre os preditores sem perder dados. Use esta opção para penalizar preditores com dados ausentes.
0,0 ≤ K ≤ 2,0, por exemplo:
  • K = 0: Não especifica nenhuma penalidade.
  • K = 2: Especifica a penalidade mais alta.
Penalidade de categoria de alto nível
Digite um valor de penalidade para preditores categóricos que tenham muitos valores. Como preditores categóricos com muitos níveis podem distorcer uma árvore devido ao seu maior poder de divisão, eles têm uma vantagem sobre os preditores com menos níveis. Use esta opção para penalizar preditores com muitos níveis.
0,0 ≤ K ≤ 5,0, por exemplo:
  • K = 0: Não especifica nenhuma penalidade.
  • K = 5: Especifica a penalidade mais alta.
Exibição de gráficos e tabelas
Taxas de matriz de confusão
Escolha as taxas que deseja exibir em sua matriz de confusão.
  • Verdadeiro positivo: Verdadeira taxa positiva (TPR) - a probabilidade de que um caso de evento seja previsto corretamente.
  • Falso positivo: Taxa falsa positiva (FPR) - a probabilidade de que um caso de não-evento seja previsto incorretamente.
  • Falso negativo: Falsa taxa negativa (FNR) - a probabilidade de que um caso de evento seja previsto incorretamente.
  • Verdadeiro negativo: Taxa negativa verdadeira (TNR) - a probabilidade de que um caso não-evento seja previsto corretamente.
Curva característica de operação do receptor (ROC)
A curva característica de operação do receptor (ROC) mostra a capacidade de uma árvore distinguir entre classes. A curva ROC traça a verdadeira taxa positiva (TPR) contra a taxa falsa positiva (FPR).
Gráfico de ganho
O gráfico de ganhos acumulados ilustra a eficácia do modelo em uma parcela da população. O gráfico de ganho parcela % classe versus % da população.
Gráfico de elevação
O gráfico de elevação ilustra a eficácia do modelo preditivo. O gráfico de elevação traça elevação acumulada versus % da população e mostra a diferença entre os resultados obtidos com e sem o modelo preditivo. Você pode especificar ou para este gráfico.
Tipo de nó terminal
Escolha se exibe os melhores nós, os piores nós ou ambos para a tabela de efetividade da tabela de classificação e os Critérios para classificar a tabela de assuntos.
  • : Por padrão, a Minitab exibe os melhores nós de terminal. Os melhores nódulos têm a maior probabilidade de evento (binário) ou os valores de maior probabilidade de classe (multinomial). Para uma resposta binária, os melhores nós têm probabilidades de eventos próximas aos dois casos finais de 1 ou 0.
  • : Selecione para exibir os piores nódulos terminais. Os piores nódulos têm a menor probabilidade de evento (binário) ou os valores de menor probabilidade de classe (multinomial). Para uma resposta binária, os piores nós têm probabilidades de eventos perto do valor médio de 0,5.
  • : Selecione para exibir os melhores e os piores nós terminais.