Percentual da estatística de erros devido aos maiores resíduos para Ajuste de modelo e Descubrir preditores-chave com Regressão TreeNet®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Use o percentual da estatística de erros para examinar a quantidade de erro nos ajustes do modelo provenientes dos piores ajustes. Quando a análise utiliza uma técnica de validação, você também pode comparar a estatística do modelo para os dados de treinamento e teste.

Cada linha da tabela mostra a estatística de erro para o percentual dado de resíduos. O percentual do Erro Padrão Médio (MSE) que vem dos maiores resíduos geralmente é maior do que o percentual para as outras duas estatísticas. O MSE utiliza os quadrados dos erros nos cálculos, de modo que as observações mais extremas normalmente exercem a maior influência sobre a estatística. Diferenças grandes entre o percentual de erro para o MSE e as outras duas medidas podem indicar que o modelo é mais sensível à seleção da divisão dos nós com o erro mínimo quadrado ou o desvio absoluto mínimo.

Quando você usa uma técnica de validação, o Minitab calcula estatísticas separadas para os dados de treinamento e para os dados de teste. Você pode comparar a estatística para examinar o desempenho relativo do modelo nos dados de treinamento e em novos dados. Normalmente, a estatística de teste é uma medida melhor do desempenho do modelo para novos dados.

Um possível padrão é que um pequena percentual dos resíduos responda por grande parte do erro nos dados. Por exemplo, na tabela a seguir, o tamanho total do conjunto de dados é de aproximadamente 4400. Sob a perspectiva do MSE, isso indica que 1% dos dados respondem por cerca de 13% do erro. Nesse caso, os 31 casos que contribuem com a maior parte do erro para o modelo podem representar a oportunidade mais natural para melhorar o modelo. Encontrar uma maneira de melhorar os ajustes para esses casos leva a um aumento relativamente grande no desempenho geral do modelo.

Essa condição também pode indicar que você pode ter maior confiança nos nós do modelo que não têm casos com os maiores erros. Como a maior parte do erro vem de um pequeno número de casos, os ajustes para os outros casos são relativamente mais exatos.

Regressão TreeNet®: Valor do emp vs Renda Anual; Proporção da; ...

Por cento de estatísticas de erro devido aos maiores resíduos % de maiores Treinamento Teste resíduos Contagem % MSE % MAD % MAPE Contagem % MSE % MAD 1,0 31 13,2824 4,9997 8,0885 14 21,6989 6,9082 2,0 62 21,3764 8,9374 12,9910 27 31,9396 11,6377 2,5 77 24,7125 10,6967 14,9989 33 35,7935 13,6106 3,0 93 27,9315 12,4817 17,0128 40 39,8022 15,7838 4,0 123 33,2979 15,6372 20,4671 53 45,8259 19,4124 5,0 154 38,1707 18,6937 23,7785 66 50,8291 22,7194 7,5 231 47,9001 25,4954 31,0104 98 59,7000 29,6264 10,0 307 55,3764 31,4216 37,0787 131 66,4339 35,7333 15,0 461 66,7462 41,8167 47,2740 196 75,4853 45,6703 20,0 614 74,8066 50,5429 55,5443 261 81,6292 53,8603 % de maiores resíduos % MAPE 1,0 9,0517 2,0 14,0987 2,5 16,1761 3,0 18,4925 4,0 22,4744 5,0 25,9526 7,5 33,2548 10,0 39,2610 15,0 48,6658 20,0 56,3489