Selecione as opções de análise para Classificação CART®

Estat > Análise preditiva > CART® Opções de  > classificação

Selecione as opções de análise.

Método de divisão de nós
Escolha o método de divisão para gerar sua árvore de decisão. Você pode comparar os resultados de vários métodos de divisão para determinar a melhor escolha para sua aplicação.
  • Gini: O método Gini é o método padrão. O método Gini funciona bem em muitas aplicações. O método Gini geralmente gera árvores que incluem nós pequenos com alta concentração da resposta de interesse.
  • Entropia: O método de Entropia é proporcional ao máximo de determinadas funções de verossimilhança para o nó.
  • Twoing: O método do critério de Twoing está disponível apenas com uma resposta multinomial. O método do critério de Twoing normalmente gera divisões mais balanceadas do que os métodos de Gini ou Entropia. Para uma resposta binária, o método do critério de Twoing é igual ao método Gini.
  • Probabilidade de classe: A árvore de probabilidade tende a ser maior que a árvore de Gini. Use o método de probabilidade quando estiver interessado no desempenho de alguns nós superiores.
Critério para seleção da árvore ótima
Escolha entre os seguintes critérios para selecionar a árvore nos resultados. Você pode comparar os resultados de diferentes árvores para determinar a melhor escolha para sua aplicação.
  • Custo mínimo de classificação errada: Selecione esta opção para exibir resultados para a árvore que minimiza o custo de classificação errada.
  • Dentro de K erros padrão do custo mínimo de classificação errada; K =: Selecione esta opção para exibir os resultados para a menor árvore com um custo de classificação errada dentro dos erros padrão de K do custo mínimo de classificação errada. Por padrão, K=1, de modo que os resultados são para a menor árvore com um custo de classificação errada dentro de 1 erro padrão da árvore com o custo mínimo de classificação errada.
Número de substitutos para um preditor com valores ausentes
Digite o número de substitutos que o Minitab deve procurar quando um preditor tem valores faltantes. Quando muitos preditores têm padrões de valor faltantes semelhantes, você deve aumentar o número de substitutos.
Esse número representa o número máximo de substitutos que o Minitab procura; no entanto, este número de substitutos pode realmente não ser encontrado.
O valor padrão é de 10.
Número mínimo de casos para dividir um nó interno
Digite o número mínimo de casos que um nó pode ter e ainda ser dividido em mais nós. O padrão é 10. Com tamanhos amostrais maiores, você pode querer aumentar esse número mínimo. Por exemplo, se um nó interno tiver 10 ou mais casos, o Minitab tenta realizar uma divisão. Se o nó interno tiver 9 casos ou menos, o Minitab não tenta realizar uma divisão.
O limite interno do nó deve ser pelo menos o dobro do limite do nó terminal, mas as proporções maiores são melhores. Os limites internos do nó de pelo menos 3 vezes os limites do nó terminal permitem um número razoável de divisores.
Número mínimo de casos permitidos para um nó terminal
Digite o número mínimo de casos que podem estar em um nó terminal. O padrão é 3. Com tamanhos amostrais maiores, você pode querer aumentar esse número mínimo. Por exemplo, se uma divisão criar um nó com menos de 3 casos, o Minitab não realiza uma divisão.
Profundidade máxima da árvore
Digite um valor para representar a profundidade máxima de uma árvore. O nó raiz corresponde a uma profundidade de 1. Se você quer ter certeza de obter a melhor árvore, precisa permitir uma árvore mais profunda, mesmo que ela possa retardar o processamento.
Pesos
Digite uma coluna que contenha os pesos do caso. A coluna deve ter o mesmo número de linhas que a coluna de resposta. Os valores devem ser ≥ 0. O Minitab omite as linhas que contenham valores faltantes ou zeros provenientes da análise.