Boxplot de resíduos para Regressão CART®

Use o boxplot dos resíduos para avaliar a exatidão geral da árvore. Quando a análise utiliza uma técnica de validação, você também pode comparar a exatidão da árvore para os dados de treinamento e teste.

O boxplot mostra a diferença entre os valores reais e ajustados. Os pontos com mais de 1,5 vezes a amplitude interquartílica do quartil mais próximo têm símbolos individuais.

Interpretação

Sob uma perspectiva ideal, os resíduos estão todos próximos de 0 em relação à escala da variável resposta. Quando você usa uma técnica de validação, o Minitab cria gráficos separados para os dados de treinamento e de teste. Você pode comparar os gráficos para examinar o desempenho relativo da árvore nos dados de treinamento e em novos dados. Você também pode procurar diferentes padrões que possam indicar uma diferença a ser investigada entre os dados de treinamento e de teste.

Esses boxplots mostram resultados semelhantes para conjuntos de dados de treinamento e de teste. Essa semelhança sugere que o desempenho da árvore em novos dados está próximo do desempenho da árvore nos dados de treinamento.

A amplitude interquartílica dos bloxplots para ambos os conjuntos de dados é de cerca de –2,6 a 2,6, sendo que 50% dos dados possuem resíduos dentro dessa faixa. Os resíduos restantes são maiores. Como a amplitude interquartílica é de cerca de 5, os resíduos que estão fora da amplitude aproximada –10,5 a 10,5 têm símbolos individuais. Os maiores resíduos estão próximos de 20 nas direções positivas e negativas. Esses resíduos grandes podem indicar que a árvore não ajusta bem todos os dados.