Optimización de hiperparámetros para Ajustar modelo y Descubrir predictores clave con Regresión TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información acerca de cómo activar el módulo.

Utilice los resultados para comparar qué tan buen rendimiento tienen los modelos con diferentes configuraciones para los hiperparámetros. Haga clic Ajustar hiperparámetros para identificar un mejor modelo para evaluar valores adicionales de los hiperparámetros.

Número óptimo de árboles

El número óptimo de árboles suele diferir en cada paso. Cuando el número óptimo está cerca del número máximo de árboles para el análisis, es más probable que el modelo mejore si aumenta el número de árboles que un modelo con un número óptimo de árboles que está lejos del máximo. Puede considerar la opción de explorar más a fondo un modelo alternativo que tenga la probabilidad de mejorar.

R-cuadrada (%)

R2 es el porcentaje de variación en la respuesta explicado por el modelo. Los valores atípicos tienen mayor efecto en R2 que en MAD.

Cuando se utiliza la función de pérdida de errores cuadradas o la función de pérdida Huber, la tabla incluye el valor de R2 para cada modelo. Los resultados siguientes son para el modelo con el valor de R2 más alto.

MAD

La desviación absoluta media (MAD) es el promedio del valor absoluto de la diferencia entre un valor pronosticado y un valor real. Mientras más pequeña sea la MAD, mejor se ajustará el modelo a los datos. La MAD expresa precisión en las mismas unidades que los datos, lo cual ayuda a conceptualizar la cantidad de error. Los valores atípicos tienen menos efecto en la MAD que en R2.

Cuando se utiliza la función de pérdida de la desviación absoluta, la tabla incluye el valor de MAD para cada modelo. Los resultados completos que siguen a la tabla son para el modelo con el menord valor de MAD.

Tasa de aprendizaje

Las tasas de aprendizaje bajas otorgan a cada nuevo árbol del modelo una ponderación menor que las tasas de aprendizaje más altas y a veces producen más árboles para el modelo. Un modelo con una tasa de aprendizaje baja tiene menos posibilidades de sobreajustarse al conjunto de datos de entrenamiento. Los modelos con bajas tasas de aprendizaje generalmente utilizan más árboles para encontrar el número óptimo de árboles.

Fracción de submuestra

La fracción de submuestra es la proporción de datos que el análisis utiliza para crear cada árbol.

Máximo de nodos terminales por árbol

Regresión TreeNet® combina muchos árboles CART® pequeños para crear un modelo potente. Puede especificar el número máximo de nodos terminales o la profundidad máxima del árbol para estos árboles CART® más pequeños. Los árboles con más nodos terminales pueden modelar interacciones más complejas. En general, los valores superiores a 12 podrían ralentizar el análisis sin beneficiar el modelo.

Profundidad máxima del árbol

Regresión TreeNet® combina muchos árboles CART® pequeños para crear un modelo potente. Puede especificar el número máximo de nodos terminales o la profundidad máxima del árbol para estos árboles CART® más pequeños. Los árboles más profundos pueden modelar interacciones más complejas. Los valores del 4 al 6 son adecuados para muchos conjuntos de datos.