Tabla de resumen del modelo para Regresión Random Forests®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Buscar definiciones y orientación para interpretar la tabla de resumen del modelo. Si agrega la validación con un conjunto de prueba a la validación con los datos out-of-bag, Minitab muestra los resultados de ambos métodos de validación.

Total de predictores

El número total de predictores disponibles para el modelo Random Forests®. El total es la suma de los predictores continuos y categóricos que usted especifique.

Predictores importantes

El número de predictores importantes en el modelo Random Forests®. Los predictores importantes tienen puntuaciones de importancia mayores que 0.0. Puede utilizar la gráfica Importancia relativa de las variables para mostrar el orden de importancia relativa de las variables. Por ejemplo, supongamos que 10 de 20 predictores son importantes en el modelo, la gráfica Importancia relativa de las variables muestra las variables en orden de importancia.

R-cuadrada

R2 es el porcentaje de variación en la respuesta explicado por el modelo.

Interpretación

Utilice R2 para determinar qué tan bien se ajusta el modelo a los datos. Cuanto mayor sea el valor de R2, mejor se ajusta el modelo a los datos. R2 siempre está entre 0% y 100%.

Puede ilustrar gráficamente el significado de diferentes valores de R2. La primera gráfica ilustra un modelo de regresión simple que explica el 85.5% de la variación en la respuesta. La segunda gráfica ilustra un modelo que explica el 22.6% de la variación en la respuesta. Cuanta más variación explique el modelo, más cerca estarán los puntos de datos de los valores ajustados. En teoría, si un modelo puede explicar el 100% de la variación, los valores ajustados siempre serían iguales a los valores observados y todos los puntos de datos se ubicarían en la línea y = x.
Nota

Dado que Random Forests® utiliza datos out-of-bag para calcular R2,pero no para ajustar al modelo, el sobreajuste del modelo no es un problema.

Raíz del error cuadrático medio (RMSE)

La raíz del error cuadrático medio (RMSE) mide la exactitud del modelo. Los valores atípicos tienen un mayor efecto en la RMSE que en la MAD y el MAPE.

Interpretación

Se utiliza para comparar los ajustes de diferentes modelos. Los valores más pequeños indican un mejor ajuste.

Error cuadrático medio (MSE)

El error cuadrático medio (MSE) mide la exactitud del modelo. Los valores atípicos tienen un mayor efecto en el MSE que en la MAD y el MAPE.

Interpretación

Se utiliza para comparar los ajustes de diferentes modelos. Los valores más pequeños indican un mejor ajuste.

Desviación absoluta media (MAD)

La desviación absoluta media (MAD) expresa la exactitud en las mismas unidades que los datos, lo que ayuda a conceptualizar la cantidad de error. Los valores atípicos tienen menos efecto en la MAD que en R2, la RMSE y el MSE.

Interpretación

Se utiliza para comparar los ajustes de diferentes modelos. Los valores más pequeños indican un mejor ajuste.

Error porcentual absoluto medio (MAPE)

El error porcentual absoluto medio (MAPE) expresa el tamaño del error en relación con el tamaño del valor de respuesta. Por lo tanto, el mismo error de tamaño tendrá un valor MAPE mayor para un valor menor de la variable de respuesta que para un valor mayor. Dado que el MAPE es un porcentaje, puede ser más fácil de entender que las otras estadísticas de medición de exactitud. Por ejemplo, si el MAPE, en promedio, es 0.05, la relación promedio entre el error ajustado y el valor real en todos los casos es de 5%. Los valores atípicos tienen menos efecto en el MAPE que en el R2, la RMSE y el MSE.

Sin embargo, a veces puede ver un valor MAPE muy grande aunque el modelo parezca ajustarse bien a los datos. Examine la gráfica de valores de respuesta ajustados vs. reales para ver si hay valores de datos cercanos a 0. Dado que el MAPE divide el error absoluto entre los datos reales, los valores cercanos a 0 pueden inflar en gran medida el MAPE.

Interpretación

Se utiliza para comparar los ajustes de diferentes modelos. Los valores más pequeños indican un mejor ajuste.