Gráfico de dispersão de MSE ou MAD vs nó terminal para Regressão CART®

Use um gráfico de dispersão de MSE versus nó terminal ou um gráfico de dispersão de MAD versus nó terminal para ver os nós com os ajustes menos exatos e os mais exatos. Quando a análise usa um conjunto de dados de teste, você pode comparar o gráfico dos dados de treinamento com o gráfico de dados de teste.

Quando o método de divisão do nó é o erro mínimo quadrado, o eixo y mostra o quadrado médio do erro (MSE). Quando o método de divisão do nó é o desvio absoluto mínimo, então o eixo Y é o desvio absoluto médio (MAD). O eixo X mostra os números de identificação dos nós terminais. Por padrão, os nós estão ordenados do menor erro ao maior erro. Ao executar a análise, você pode encontrar uma opção para ordenar os nós por número de identificação pressionando o botão Gráficos.

Interpretação

Sob a perspectiva ideal, se uma árvore ajusta bem os dados, todos os nós têm uma pequena quantidade de erro. Um padrão comum é que o erro em alguns nós seja maior do que outros. Você pode ter a máxima confiança nos ajustes dos nós com o menos erros. Os nós com mais erros podem representar as melhores oportunidades para melhorar a árvore, aprendendo a reduzir a variação ou encontrando variáveis preditoras adicionais que explicam a variação do nó.

Quando a análise utiliza um conjunto de dados de teste, o gráfico inclui pontos separados para os dados de treinamento e de teste. Normalmente, o desempenho da árvore nos dados de teste é uma representação melhor do desempenho da árvore para novos dados. Você deve investigar as diferenças grandes na exatidão dos ajustes entre os dados de teste e treinamento.

Neste gráfico, a exatidão do nó terminal 8 é pior do que para os outros nós terminais. Você pode ter uma confiança relativamente maior na exatidão dos ajustes para os nós com valores de MSE mais baixos. Os casos no nó terminal 8 podem ter a maior oportunidade de melhorar a árvore se houver uma maneira de reduzir ou explicar a variação.