Seleccionar los valores de hiperparámetro para ajustar Ajustar modelo y Descubrir predictores clave con Regresión TreeNet®

Ejecute Módulo de análisis predictivo > Regresión TreeNet® > Ajustar modelo. Marca Ajustar hiperparámetros en los resultados.

Ejecute Módulo de análisis predictivo > Regresión TreeNet® > Descubrir predictores clave. Marca Ajustar hiperparámetros en los resultados.

Revisión general

El rendimiento de los modelos de TreeNet® suele ser sensible a los valores de la tasa de aprendizaje, la fracción de submuestras y la complejidad de los árboles individuales que forman el modelo. En los resultados de un modelo, haga clic en Ajustar hiperparámetros para evaluar múltiples valores de la tasa de aprendizaje, la fracción de submuestras y un parámetro de complejidad de árbol individual para saber qué combinación produce los mejores valores de un criterio de precisión, como el valor máximo de R2.

Parámetros de protección de sobreajuste

Especifique uno o varios valores para cada uno de los parámetros que protegen el análisis de sobreajuste. El análisis evalúa los parámetros para encontrar la combinación con el mejor valor del criterio de precisión. Si no introduce ningún valor para un parámetro, la evaluación utiliza el valor para ese parámetro del modelo en los resultados.
Tasa de aprendizaje
Introduzca hasta 10 valores. Los valores de correlación van de 0.0001 a 1. A menos que seleccione Evaluar combinaciones completas de parámetros, la evaluación de la tasa de aprendizaje es la primera. Si la evaluación se realiza primero, la evaluación de la tasa de aprendizaje utiliza el valor mínimo de la tasa de aprendizaje y la fracción de submuestras.
Fracción de submuestra
Introduzca hasta 10 valores. Los valores elegibles son superiores a 0 y menores o iguales a 1. A menos que seleccione Evaluar combinaciones completas de parámetros, la evaluación de la submuestra es la segunda. Si la evaluación se realiza en segundo lugar, la evaluación de la fracción de submuestras utiliza el mejor valor encontrado por el análisis para la tasa de aprendizaje y el valor mínimo de la fracción de submuestras.
Parámetro de complejidad de árbol individual
Elija si desea evaluar el Máximo de nodos terminales archivo o el Profundidad máxima del árbol. Por lo general, cualquiera de las dos opciones es una forma razonable de identificar un modelo útil y la selección depende únicamente de las preferencias individuales. A menos que seleccione Evaluar combinaciones completas de parámetros, la evaluación del parámetro de complejidad es la última. Si la evaluación se realiza al final, la evaluación utiliza el mejor valor ya encontrado por el análisis para la tasa de aprendizaje y para la fracción de submuestras.
Máximo de nodos terminales
Introduzca hasta 3 valores. Los valores comunes se encuentran entre 2 y 2000. Por lo general, el valor predeterminado de 6 proporciona un buen equilibrio entre la velocidad de cálculo y la investigación de las interacciones entre variables. Un valor de 2 elimina la investigación de las interacciones.
Profundidad máxima del árbol
Introduzca hasta 3 valores. Ingrese un valor entre 2 y 1000 para representar la profundidad máxima de un árbol. El nodo raíz corresponde a una profundidad de 1. En muchas aplicaciones, las profundidades de 4 a 6 proporcionan modelos razonablemente adecuados.

Número de árboles

Ingrese un valor entre 1 y 5000 para establecer el número máximo de árboles que se construirán. El valor predeterminado de 300 normalmente proporciona resultados útiles para la evaluación de los valores del hiperparámetro.

Si varios modelos con valores similares del criterio de precisión tienen un número de árboles cercanos al número de árboles que especifique, considere si desea aumentar el número de árboles para determinar si el modelo elegido es sensible al número de árboles.

Evaluar combinaciones completas de parámetros

Si especifica valores para más de un parámetro de protección de sobreajuste, los modelos de la tabla de evaluación dependen de si evalúa las combinaciones completas de los parámetros.
  • Si selecciona Evaluar combinaciones completas de parámetros, el algoritmo evalúa cada combinación de los parámetros. Esta opción generalmente tarda más en calcularse.
  • De lo contrario, el algoritmo evalúa los parámetros en este orden:
    1. Tasa de aprendizaje
    2. Fracción de submuestra
    3. Parámetro de complejidad de árbol individual

    Para un parámetro que el algoritmo no ha evaluado, el algoritmo utiliza el valor más pequeño para evaluar parámetros anteriores. Para un parámetro que el algoritmo ha evaluado, el algoritmo utiliza el mejor valor.

    Por ejemplo, supongamos que el algoritmo recibe los siguientes parámetros:
    • Tasas de aprendizaje: 0.001, 0.01, 0.1
    • Fracciones de submuestras: 0.4, 0.5, 0.7
    • Número máximo de nodos terminales: 4, 6
    1. El algoritmo establece la proporción de submuestras en 0.4 y el número máximo de nodos terminales en 4. A continuación, el algoritmo evalúa las tasas de aprendizaje en orden de menor a mayor: 0.001, 0.01, 0.1.
    2. Supongamos que el algoritmo identifica 0.01 como la mejor tasa de aprendizaje. Después, el algoritmo establece la tasa de aprendizaje en 0.01 y el número máximo de nodos terminales en 4. A continuación, el algoritmo evalúa las proporciones de submuestras de 0.4, 0.5 y 0.7.
    3. Supongamos que el algoritmo identifica 0.5 como la mejor proporción de submuestras. Después, el algoritmo establece la tasa de aprendizaje en 0.01 y la proporción de submuestras en 0.5. A continuación, el algoritmo evalúa el número máximo de nodos de 4 y 6.
    4. Supongamos que el algoritmo identifica 6 como el mejor número máximo de nodos terminales. Entonces, Minitab produce la tabla de evaluación y los resultados para el modelo con la tasa de aprendizaje = 0.01, la proporción de submuestras 0.5 y el número máximo de nodos terminales 6.

    En este ejemplo, el análisis que no evalúa el conjunto completo de combinaciones de parámetros incluye 8 modelos en la tabla de evaluación. El análisis con toda la combinación de parámetros tendría 18 combinaciones y tardaría más en calcularse.