Selecione uma árvore alternativa para Classificação CART®

Executar Estat > Análise preditiva > CART® classificação. Clique no botão Selecionar uma árvore alternativa para o Gráfico de custo de classificação errada vs. número de nós terminais.

Visão geral

Por padrão, o Minitab Statistical Software produz uma saída para a menor árvore com um custo de classificação errada dentro de 1 erro padrão do menor custo de classificação errada. O Minitab permite explorar outras árvores na sequência que levou à identificação da árvore ótima. Normalmente, você seleciona uma árvore alternativa por uma das duas razões a seguir:
  • A árvore ótima faz parte de um padrão em que os custos de classificação errada diminuem. Uma ou mais árvores que têm mais alguns nós fazem parte do mesmo padrão. Normalmente, é aconselhável fazer predições de uma árvore com o máximo de exatidão de predição possível. Se a árvore é simples o suficiente, também é possível usá-la para entender como cada variável preditora afeta os valores de resposta.
  • A árvore ótima é parte de um padrão em que os custos de classificação errada são relativamente planos. Uma ou mais árvores com estatística semelhantes de sumário do modelo têm muito menos nós do que a árvore ótima. Normalmente, uma árvore com menos nós terminais proporciona uma visão mais clara de como cada variável preditora afeta os valores de resposta. Uma árvore menor também facilita a identificação de alguns grupos-alvo para a realização de estudos adicionais. Se a diferença na exatidão da predição para uma árvore menor for insignificante, você também pode usar a árvore menor para avaliar as relações entre a resposta e as variáveis preditoras
Por exemplo, no gráfico a seguir, a árvore com 4 nós é a árvore ótima. As próximas duas árvores maiores fazem parte de um padrão em que o custo de classificação errada diminui.
A árvore de 7 nós tem um custo de classificação errada menor do que o custo da árvore de 4 nós. Como a árvore de 7 nós é semelhante na complexidade, é possível usar a árvore maior com sua exatidão adicional de predição para estudar as variáveis importantes e fazer predições.
Além dos valores de critério para árvores alternativas, você também pode comparar a complexidade das árvores e a utilidade de nós diferentes. Considere os seguintes exemplos de razões pelas quais um analista escolhe uma determinada árvore que não sacrifica o desempenho quando comparada a outras árvores:
  • O analista escolhe uma árvore menor que proporciona uma visão mais clara das variáveis mais importantes.
  • A análise escolhe uma árvore porque as divisões estão em variáveis mais fáceis de serem medidas do que as variáveis em outra árvore.
  • O analista escolhe uma árvore porque um determinado nó terminal é de interesse.

Realize a análise

Clique em Selecionar uma árvore alternativa na saída. É aberta uma caixa de diálogo mostrando um gráfico, um diagrama de árvore e uma tabela que sumariza a árvore ou o nó selecionado.

Selecione uma árvore alternada

A caixa de diálogo oferece três maneiras de selecionar árvores alternativas:
  • Clique em um ponto no gráfico.
  • Clique nos botões de seta sob a tabela de sumário do modelo para selecionar uma árvore maior ou menor do que a seleção atual.
  • Clique em um botão para selecionar uma árvore que seja uma escolha comum. Os botões que se referem ao erro padrão não são aplicáveis no caso de a análise não usar validação, .
    Custo Min
    Selecione a árvore com o custo mínimo de classificação errada
    1 EP de Custo Mín.
    Selecione a menor árvore que tenha um custo de classificação errada dentro de um erro padrão do custo mínimo.
    1 EP de Custo Mín.
    Selecione a menor árvore que tenha um custo de classificação errada dentro de 2 erros padrão do custo mínimo.
    Melhor ROC
    Selecione a árvore com a maior área sob a curva ROC.

Investigue a árvore e os nós individuais

A árvore oferece as seguintes interações na barra de ferramentas:
  • Destaque os 5 nós com maior grau de pureza. Esses nós são os nós ótimos.
  • Alterne entre o Árvore Detalhada e o Árvore da subdivisão do nó. O Árvore da subdivisão do nó é útil quando você tem uma árvore grande e quer ver apenas quais variáveis dividem os nós.
  • Aplique o zoom na árvore para aumentar e diminuir.

Você pode selecionar nós individuais na árvore para ver detalhes sobre o nó na tabela. Os detalhes incluem contagens de classes individuais e a contagem total. Os detalhes também incluem as regras para chegar ao nó. Clique Copiar regras para a área de transferência para que poder colar as regras em outro lugar.

Para selecionar novamente toda a árvore, clique em qualquer lugar no diagrama que não seja um nó individual.

Criação de uma nova árvore

Clique em Criar árvore para criar e armazenar resultados para uma árvore alternativa de sua escolha. As seleções de resultados e armazenamento são as mesmas da árvore original. Os gráficos e tabelas para a árvore alternativa estão em uma nova guia de saída. As colunas armazenadas estão na worksheet com os dados originais.