Boxplot de resíduos para Regressão CART®

Use o boxplot dos resíduos para avaliar a exatidão geral da árvore. Quando a análise utiliza uma técnica de validação, você também pode comparar a precisão da árvore para os dados de treinamento e os resultados da validação.

O boxplot mostra a diferença entre os valores reais e ajustados. Os pontos com mais de 1,5 vezes a amplitude interquartílica do quartil mais próximo têm símbolos individuais.

Interpretação

Sob uma perspectiva ideal, os resíduos estão todos próximos de 0 em relação à escala da variável resposta. Quando você usa uma técnica de validação, o Minitab cria gráficos separados para os dados de treinamento e para os resultados da validação. Você pode comparar os gráficos para examinar o desempenho relativo da árvore nos dados de treinamento e em novos dados. Você também pode procurar diferentes padrões que possam indicar uma diferença para investigar entre os dados de treinamento e os resultados da validação.

Esses boxplots apresentam resultados semelhantes para o conjunto de dados de treinamento e para os resultados de validação. Essa semelhança sugere que o desempenho da árvore em novos dados está próximo do desempenho da árvore nos dados de treinamento.

A faixa interquartil dos boxplots para ambos os conjuntos de dados varia de cerca de –2,6 a 2,6. 50% dos dados têm resíduos dentro dessa faixa. Os resíduos restantes são maiores. Como a amplitude interquartílica é de cerca de 5, os resíduos que estão fora da amplitude aproximada –10,5 a 10,5 têm símbolos individuais. Os maiores resíduos estão próximos de 20 nas direções positivas e negativas. Esses resíduos grandes podem indicar que a árvore não ajusta bem todos os dados.