Por padrão, o Minitab Statistical Software produz uma saída para a menor árvore com um custo de classificação errada dentro de 1 erro padrão do menor custo de classificação errada. O Minitab permite explorar outras árvores na sequência que levou à identificação da árvore ótima. Normalmente, você seleciona uma árvore alternativa por uma das duas razões a seguir:
- A árvore ótima faz parte de um padrão em que os custos de classificação errada diminuem. Uma ou mais árvores que têm mais alguns nós fazem parte do mesmo padrão. Normalmente, é aconselhável fazer predições de uma árvore com o máximo de exatidão de predição possível. Se a árvore é simples o suficiente, também é possível usá-la para entender como cada variável preditora afeta os valores de resposta.
- A árvore ótima é parte de um padrão em que os custos de classificação errada são relativamente planos. Uma ou mais árvores com estatística semelhantes de sumário do modelo têm muito menos nós do que a árvore ótima. Normalmente, uma árvore com menos nós terminais proporciona uma visão mais clara de como cada variável preditora afeta os valores de resposta. Uma árvore menor também facilita a identificação de alguns grupos-alvo para a realização de estudos adicionais. Se a diferença na exatidão da predição para uma árvore menor for insignificante, você também pode usar a árvore menor para avaliar as relações entre a resposta e as variáveis preditoras
Por exemplo, no gráfico a seguir, a árvore com 4 nós é a árvore ótima. As próximas duas árvores maiores fazem parte de um padrão em que o custo de classificação errada diminui.
A árvore de 7 nós tem um custo de classificação errada menor do que o custo da árvore de 4 nós. Como a árvore de 7 nós é semelhante na complexidade, é possível usar a árvore maior com sua exatidão adicional de predição para estudar as variáveis importantes e fazer predições.
Além dos valores de critério para árvores alternativas, você também pode comparar a complexidade das árvores e a utilidade de nós diferentes. Considere os seguintes exemplos de razões pelas quais um analista escolhe uma determinada árvore que não sacrifica o desempenho quando comparada a outras árvores:
- O analista escolhe uma árvore menor que proporciona uma visão mais clara das variáveis mais importantes.
- A análise escolhe uma árvore porque as divisões estão em variáveis mais fáceis de serem medidas do que as variáveis em outra árvore.
- O analista escolhe uma árvore porque um determinado nó terminal é de interesse.