Optimización de hiperparámetros para Descubrir el mejor modelo (Respuesta continua)

Nota

Este comando está disponible con el módulo Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.

Buscar definiciones y orientación para interpretar la tabla de Optimización de hiperparámetros

Después de crear un modelo con Descubrir el mejor modelo (Respuesta continua), puede hacer clic en Seleccione un modelo alternativo para explorar otros modelos. Si selecciona un modelo de Random Forests ®, una opción es especificar hiperparámetros que se ajusten a nuevos modelos. Si especifica hiperparámetros, los resultados incluirán la tabla Optimización de hiperparámetros. La tabla compara las combinaciones de hiperparámetros. Los resultados siguientes a la tabla Optimización de hiperparámetros son para el modelo con el mejor valor del criterio de optimalidad, como el valor máximo de R2.

R-cuadrada

R2 es el porcentaje de variación en la respuesta explicado por el modelo.

Interpretación

Utilice el valor de R2 para determinar qué tan bien se ajusta el modelo a los datos. Cuanto mayor sea el valor de R2, mejor se ajusta el modelo a los datos. R2 siempre se encuentra entre 0% y 100%.

Puede ilustrar gráficamente el significado de diferentes valores de R2. La primera gráfica ilustra un modelo de regresión simple que explica el 85.5% de la variación en la respuesta. La segunda gráfica ilustra un modelo que explica el 22.6% de la variación en la respuesta. Cuanta más variación explique el modelo, más cerca estarán los puntos de datos de los valores ajustados. En teoría, si un modelo puede explicar el 100% de la variación, los valores ajustados siempre serían iguales a los valores observados y todos los puntos de datos se ubicarían en la línea y = x.
Nota

Debido a que Random Forests® utiliza datos out-of-bag para calcular R2, pero no para ajustar el modelo, el sobreajuste del modelo no es un tema de preocupación.

Desviación absoluta media (MAD)

La desviación absoluta media (MAD) expresa la exactitud en las mismas unidades que los datos, lo que ayuda a conceptualizar la cantidad de error. Los valores atípicos tienen menos efecto en la MAD que en R2.

Interpretación

Se utiliza para comparar los ajustes de diferentes modelos. Valores más pequeños indican un mejor ajuste.

Recuento de predictores para la división de nodos

Esta fila indica la elección del número de predictores a considerar.

Tamaño mínimo del nodo interno

El tamaño mínimo del nodo interno indica el número mínimo de casos que un nodo puede tener y aún dividirse en más nodos.

Número de muestras con reemplazamiento (bootstrap)

El número de muestras con reemplazamiento (bootstrap) indica el número de árboles en el análisis.