Ejecute . Marca Ajustar hiperparámetros en los resultados.
Ejecute . Marca Seleccionar modelo alternativo en los resultados.
Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.
El rendimiento de los modelos TreeNet® es generalmente sensible a los valores de la tasa de aprendizaje, la fracción de submuestra y la complejidad de los árboles individuales que forman el modelo. En los resultados de un modelo, haz clic Ajustar hiperparámetros para evaluar múltiples valores de estos hiperparámetros y así saber qué combinación produce los mejores valores de un criterio de precisión, como el valor máximo deR2 . Mejores valores de estos hiperparámetros tienen el potencial de mejorar significativamente la precisión de las predicciones, por lo que la exploración de diferentes valores es un paso común en el análisis.
También puedes ajustar el número de predictores para la división de nodos y el número de árboles que incluye el modelo. Normalmente, el análisis funciona bien si consideras todos los predictores en cada nodo. Sin embargo, algunos conjuntos de datos tienen asociaciones entre los predictores que conducen a un mejor rendimiento del modelo cuando el análisis considera un subconjunto aleatorio diferente de predictores en cada nodo.
En general, 300 árboles son suficientes para distinguir los valores de los hiperparámetros. Generalmente, se aumenta el número de árboles cuando el número óptimo de árboles para uno o más modelos de interés está cerca del número máximo de árboles. Si el número de árboles está más cerca del número máximo, es más probable que un aumento en el número de árboles mejore el rendimiento del modelo.
Especifica uno o más valores para cada hiperparámetro a evaluar. El análisis evalúa los hiperparámetros para encontrar la combinación con el mejor valor del criterio de precisión. Si no introduces ningún valor para un hiperparámetro, la evaluación utiliza el valor de ese hiperparámetro del modelo en los resultados. Si la respuesta es binaria y el modelo original especifica la proporción de eventos y no eventos a muestrear, la evaluación siempre utiliza las proporciones del modelo original.
Introduzca hasta 10 valores. Los valores elegibles se encuentran entre 0.0001 y 1. A menos que selecciones Evaluar combinaciones completas de parámetros, la evaluación de la tasa de aprendizaje es la primera. Si la evaluación se realiza primero, entonces la evaluación de la tasa de aprendizaje utiliza el valor mínimo de la tasa de aprendizaje y la fracción submuestral.
Introduzca hasta 10 valores. Los valores elegibles son superiores a 0 e inferiores o iguales a 1. A menos que selecciones Evaluar combinaciones completas de parámetros, la evaluación de la submuestra es la segunda. Si la evaluación se realiza en segundo lugar, entonces la evaluación de la fracción submuestral utiliza el mejor valor que el análisis encontró para la tasa de aprendizaje y el valor más bajo de la fracción submuestral.
Fracción de submuestra se deshabilita cuando el modelo original especifica la proporción de eventos y no eventos a muestrear para una respuesta binaria.
Introduzca hasta 3 valores. Los valores elegibles se encuentran entre 1 y el número total de predictores. En general, el análisis funciona bien cuando se considera el número total de predictores. Sin embargo, algunos conjuntos de datos tienen asociaciones entre los predictores que generan mejor rendimiento del modelo cuando el análisis considera un número menor de predictores para cada nodo.
Ingrese un valor entre 1 y 5000 para establecer el número máximo de árboles que se construirán. El valor predeterminado de 300 generalmente proporciona resultados útiles para la evaluación de los valores de hiperparámetros.
Si uno o más modelos de interés tienen un número de árboles cercano al número de árboles que especificó, entonces considere si desea incrementar el número de árboles.. Si el número de árboles está más cerca del número máximo, es más probable que un aumento en el número de árboles mejore el rendimiento del modelo.
En este ejemplo, el análisis que no evalúa el conjunto completo de combinaciones de parámetros incluye 8 modelos en la tabla de evaluación. Un análisis de todas las combinaciones de parámetros tiene 3 × 3 × 2 = 18 combinaciones y tarda más en calcularse.
Después de especificar los valores a examinar, haz clic Mostrar resultadosen . En un nuevo conjunto de resultados, Minitab produce una tabla que compara el criterio de precisión para las combinaciones de hiperparámetros y los resultados del modelo con el mejor valor del criterio de precisión.
Minitab recrea las mismas tablas y gráficos para el nuevo modelo que para el modelo original. Las tablas y gráficos para el nuevo modelo están en un nuevo conjunto de resultados. El almacenamiento es el mismo que en el análisis original. Las columnas de almacenamiento están en la misma hoja de cálculo. Por ejemplo, si el análisis original almacenaba los valores ajustados en una columna titulada "Ajustar", entonces el nuevo análisis titula una columna vacía como "Fit_1" y almacena los valores ajustados.