Percentual da estatística de erros devido aos maiores resíduos para Regressão Random Forests®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Use o percentual da estatística de erros para examinar a quantidade de erro nos ajustes do modelo provenientes dos piores ajustes.

Cada linha da tabela mostra a estatística de erro para o percentual dado de resíduos. O percentual do Erro Padrão Médio (MSE) que vem dos maiores resíduos geralmente é maior do que o percentual para as outras duas estatísticas. O MSE utiliza os quadrados dos erros nos cálculos, de modo que as observações mais extremas normalmente exercem a maior influência sobre a estatística.

Se você selecionar validação com um conjunto de teste, além da validação com dados usando método out-of-bag, a tabela exibirá os resultados para os dados out-of-bag e para os dados do conjunto de teste.

Um possível padrão é que um pequena percentual dos resíduos responda por grande parte do erro nos dados. Por exemplo, na tabela a seguir, o tamanho total do conjunto de dados é de aproximadamente 2930. Sob a perspectiva do MSE, isso indica que 1% dos dados respondem por cerca de 36% do erro. Nesse caso, os 30 casos que contribuem com a maior parte do erro para o modelo podem representar a oportunidade mais natural para melhorar o modelo. Encontrar uma maneira de melhorar os ajustes para esses casos leva a um aumento relativamente grande no desempenho geral do modelo.

Essa condição também pode indicar que você pode ter maior confiança nos nós do modelo que não têm casos com os maiores erros. Como a maior parte do erro vem de um pequeno número de casos, os ajustes para os outros casos são relativamente mais exatos.

Regressão Random Forests®: Preço de ven vs frontage lot; área de lote; ...

Por cento de estatísticas de erro devido aos maiores resíduos % de maiores Out-of-Bag resíduos Contagem % MSE % MAD % MAPE 1,0 30 36,3855 9,5840 13,0409 2,0 59 46,9434 14,8347 18,0932 2,5 74 50,3622 16,9953 20,2317 3,0 88 53,1701 18,8880 22,0186 4,0 118 58,0879 22,5527 25,4151 5,0 147 62,0425 25,7845 28,3840 7,5 220 69,7824 32,9504 34,8161 10,0 293 75,0273 38,8507 40,2386 15,0 440 82,2816 48,6881 49,2733 20,0 586 86,9557 56,5610 56,7304