Porcentaje de estadísticas de error debido a residuos más grandes para Regresión Random Forests®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Utilice el porcentaje de estadísticas de error para examinar la cantidad de errores en los ajustes del modelo a partir de los peores ajustes.

Cada fila de la tabla muestra las estadísticas de error para el porcentaje dado de residuos. El porcentaje del error cuadrático medio (MSE) que proviene de los residuos más grandes es generalmente mayor que el porcentaje de las otras dos estadísticas. El MSE utiliza los cuadrados de los errores en los cálculos, así que las observaciones más extremas normalmente tienen mayor influencia en la estadística.

Si selecciona la validación con un conjunto de pruebas además de la validación out of bag, la tabla muestra los resultados tanto de los datos out of bag como de los datos del conjunto de pruebas.

Un patrón posible es que un pequeño porcentaje de los residuos explique gran parte del error en los datos. Por ejemplo, en la tabla siguiente, el tamaño total del conjunto de datos es de aproximadamente 2930. Desde la perspectiva del MSE, eso indica que el 1% de los datos explican alrededor del 36% del error. En ese caso, los 30 casos que aportan la mayor parte del error al modelo pueden representar la oportunidad más natural de mejorar el modelo. Encontrar una manera de mejorar los ajustes para esos casos conduce a un aumento relativamente grande en el rendimiento general del modelo.

Esta condición también puede indicar que usted puede tener mayor confianza en los nodos del modelo que no incluyen casos con los errores más grandes. Debido a que la mayor parte del error proviene de un pequeño número de casos, los ajustes para los otros casos son relativamente más exactos.

Random Forests® Regresión: Precio de ve vs fachada de l, área de lote, ...

Porcentaje de estadísticas del error debido a los residuos más grandes % de los residuos más Out-of-Bag grandes Conteo % MSE % MAD % MAPE 1.0 30 36.3855 9.5840 13.0409 2.0 59 46.9434 14.8347 18.0932 2.5 74 50.3622 16.9953 20.2317 3.0 88 53.1701 18.8880 22.0186 4.0 118 58.0879 22.5527 25.4151 5.0 147 62.0425 25.7845 28.3840 7.5 220 69.7824 32.9504 34.8161 10.0 293 75.0273 38.8507 40.2386 15.0 440 82.2816 48.6881 49.2733 20.0 586 86.9557 56.5610 56.7304