Percentual das estatísticas de erro devido aos maiores resíduos para Ajuste de modelo e Descubrir preditores-chave com Regressão TreeNet^®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Use o percentual da estatística de erros para examinar a quantidade de erro nos ajustes do modelo provenientes dos piores ajustes. Quando a análise utiliza uma técnica de validação, você também pode comparar as estatísticas do modelo para os dados de treinamento e os resultados da validação.

Cada linha da tabela mostra a estatística de erro para o percentual dado de resíduos. A porcentagem do Erro Quadrático Médio (MSE) que vem dos maiores resíduos geralmente é maior do que a porcentagem das outras duas estatísticas. O MSE utiliza os quadrados dos erros nos cálculos, de modo que as observações mais extremas normalmente exercem a maior influência sobre a estatística. Grandes diferenças entre a porcentagem de erro da MSE e das outras duas medidas podem indicar que a modelo é mais sensível à seleção de dividir os nós com menor erro quadrático ou menor desvio absoluto.

Quando você usa uma técnica de validação, o Minitab calcula estatísticas separadas para os dados de treinamento e para os resultados da validação. Você pode comparar a estatística para examinar o desempenho relativo do modelo nos dados de treinamento e em novos dados. As estatísticas de validação geralmente são uma medida melhor de como o modelo irá se comportar para novos dados.

Um possível padrão é que um pequena percentual dos resíduos responda por grande parte do erro nos dados. Por exemplo, na tabela a seguir, o tamanho total do conjunto de dados é de aproximadamente 4400. Sob a perspectiva do MSE, isso indica que 1% dos dados respondem por cerca de 13% do erro. Nesse caso, os 31 casos que contribuem com a maior parte do erro para o modelo podem representar a oportunidade mais natural para melhorar o modelo. Encontrar uma maneira de melhorar os ajustes para esses casos leva a um aumento relativamente grande no desempenho geral do modelo.

Essa condição também pode indicar que você pode ter maior confiança nos nós do modelo que não têm casos com os maiores erros. Como a maior parte do erro vem de um pequeno número de casos, os ajustes para os outros casos são relativamente mais exatos.

Por cento de estatísticas de erro devido aos maiores resíduos

% de maiores resíduos	Treinamento				Teste
% de maiores resíduos	Contagem	% MSE	% DAM	% MAPE	Contagem	% MSE	% DAM	% MAPE
1,0	31	13,2824	4,9997	8,0885	14	21,6989	6,9082	9,0517
2,0	62	21,3764	8,9374	12,9910	27	31,9396	11,6377	14,0987
2,5	77	24,7125	10,6967	14,9989	33	35,7935	13,6106	16,1761
3,0	93	27,9315	12,4817	17,0128	40	39,8022	15,7838	18,4925
4,0	123	33,2979	15,6372	20,4671	53	45,8259	19,4124	22,4744
5,0	154	38,1707	18,6937	23,7785	66	50,8291	22,7194	25,9526
7,5	231	47,9001	25,4954	31,0104	98	59,7000	29,6264	33,2548
10,0	307	55,3764	31,4216	37,0787	131	66,4339	35,7333	39,2610
15,0	461	66,7462	41,8167	47,2740	196	75,4853	45,6703	48,6658
20,0	614	74,8066	50,5429	55,5443	261	81,6292	53,8603	56,3489

Percentual das estatísticas de erro devido aos maiores resíduos para Ajuste de modelo e Descubrir preditores-chave com Regressão TreeNet®

Observação

Por cento de estatísticas de erro devido aos maiores resíduos

Percentual das estatísticas de erro devido aos maiores resíduos para Ajuste de modelo e Descubrir preditores-chave com Regressão TreeNet^®