Boxplot de respostas por nó terminal para Regressão CART®

Os boxplots oferecem um sumário gráfico da distribuição da variável resposta em cada nó terminal. Use os bloxplots para comparar a forma, a tendência central e a variabilidade dos nós. Os boxplots são representações visuais melhores dos valores de resposta quando o número de casos em um nó terminal é superior a 20.

Interpretação

Por padrão, os nós estão ordenados do menor erro ao maior erro. Ao executar a análise, você pode encontrar uma opção para ordenar os nós por número de identificação pressionando o botão Gráficos.

Quando a análise usa um conjunto de dados de teste, o gráfico inclui boxplots separados para os dados de treinamento e de teste. Normalmente, o desempenho da árvore nos dados de teste é uma representação melhor do desempenho da árvore para novos dados. Você deve investigar diferenças grandes entre os dados de teste e de treinamento.

No gráfico a seguir, 3 das maiores medianas são para os nós terminais 17, 16 e 14, que também têm os menores erros. O nó terminal 1 tem a menor mediana. Os nós terminais 1 e 3 têm um outlier cada, enquanto outros nós terminais com outliers têm mais de 1. O erro para o nó terminal 8 é maior.