Seleccionar un modelo alternativo para Descubrir el mejor modelo (Respuesta binaria)

Ejecute Módulo de análisis predictivo > Descubrir el mejor modelo (Respuesta binaria). Marca Seleccionar modelo alternativo en los resultados.
Nota

Este comando está disponible con el módulo Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.

Revisión general

Cuando se utiliza Descubrir el mejor modelo (Respuesta binaria) para identificar el mejor tipo de modelo, Minitab Statistical Software genera resultados para el modelo con el mejor valor del criterio de precisión para el análisis, como la log-verosimilitud mínima promedio. Minitab le permite explorar los resultados de otros modelos y otros tipos de modelos. Por ejemplo, si otro tipo de modelo genera una precisión de predicción similar, puede determinar si los mismos predictores son importantes en cada tipo de modelo.

Las opciones disponibles dependen del tipo de modelo. Para los modelos CART® y de regresión logística binaria, puede examinar los resultados para el mejor modelo desde la búsqueda. Para los modelos Random Forests® y TreeNet®, puede examinar los resultados de cualquiera de los modelos de la búsqueda. Para los modelos Random Forests® y TreeNet®, también puede ajustar los hiperparámetros para buscar combinaciones que generen valores aún mejores que los hiperparámetros de la búsqueda.

Random Forests®

Seleccione un modelo existente para generar resultados para uno de los modelos de la búsqueda. Especifique hiperparámetros que se ajusten a los nuevos modelos para buscar combinaciones de hiperparámetros que mejoren el rendimiento del modelo.

Seleccionar un modelo existente

En la búsqueda del mejor tipo de modelo, el análisis genera hasta 3 modelos de Random Forests® con diferentes tamaños mínimos para los nodos internos. Seleccione un modelo de la lista y haga clic en Mostrar resultados para generar los resultados para ese modelo.

Especificar hiperparámetros para ajustar nuevos modelos

El análisis requiere que especifique los primeros 3 hiperparámetros. La inclusión de un tamaño de muestra con reemplazamiento (bootstrap) inferior al tamaño de los datos de entrenamiento es opcional. Haga clic en Mostrar resultados para evaluar los hiperparámetros de los nuevos modelos. Los resultados incluyen una tabla que compara los criterios de optimalidad para las diferentes combinaciones de hiperparámetros y los resultados del modelo para el modelo con el mejor valor del criterio de optimalidad, como la log-verosimilitud mínima promedio.
Número de predictores para la división de nodo
Especifique de 1 a 3 predictores que se tomarán en cuenta en cada división de nodos. Normalmente, el análisis funciona bien si se considera la raíz cuadrada del número total de predictores. Sin embargo, algunos conjuntos de datos tienen asociaciones entre los predictores que conducen a un mejor rendimiento del modelo cuando el análisis considera un número mayor o menor de predictores para cada nodo.
Número mínimo de casos para dividir un nodo interno
Indique 1 a 3 opciones que especifiquen el número mínimo de casos que un nodo puede tener y aún dividirse en más nodos. De forma predeterminada, la búsqueda original incluye los números 2, 5 y 8.
Número de muestras de bootstrap para cultivar árboles
Ingrese un valor para determinar el número de muestras con reemplazamiento (bootstrap) y el número de árboles generados por el análisis. Ingrese un valor entre 3 y 3000.
Especifique un tamaño de muestra de bootstrap menor que el tamaño de los datos de entrenamiento
Seleccione esta opción para especificar un valor que establezca el tamaño de la muestra con reemplazamiento (bootstrap) Debe ingresar un valor mayor que o igual a 5. Si ingresa un tamaño que es mayor que el tamaño de los datos de entrenamiento, Minitab utiliza un tamaño de muestra igual al tamaño de los datos de entrenamiento.

TreeNet®

Seleccione un modelo existente para generar resultados para uno de los modelos de la búsqueda. Especifique hiperparámetros que se ajusten a los nuevos modelos para buscar combinaciones de hiperparámetros que mejoren el rendimiento del modelo.

Seleccionar un modelo existente

En la búsqueda del mejor tipo de modelo, el análisis genera un modelo TreeNet® para cada combinación de hiperparámetros. Seleccione un modelo de la lista y haga clic en Mostrar resultados para generar los resultados para ese modelo.

Especificar hiperparámetros para ajustar nuevos modelos

El análisis requiere que especifique todos los hiperparámetros. Haga clic en Mostrar resultados para evaluar los hiperparámetros de los nuevos modelos. Los resultados incluyen una tabla que compara los criterios de optimalidad para las diferentes combinaciones de hiperparámetros y los resultados para el modelo con el mejor valor del criterio de precisión para el análisis, la log-verosimilitud mínima promedio.

Tasa de aprendizaje
Introduzca hasta 10 valores. Los valores elegibles se encuentran entre 0.0001 y 1.
Fracción de submuestra
Introduzca hasta 10 valores. Los valores elegibles son superiores a 0 e inferiores o iguales a 1.
Máximo de nodos terminales por árbol y Profundidad máxima del árbol
Elija si desea evaluar el modelo Máximo de nodos terminales por árbol o el modelo Profundidad máxima del árbol. Por lo general, cualquiera de las dos opciones es una forma razonable de identificar un modelo útil, de modo que esta elección depende únicamente de la preferencia individual.
Máximo de nodos terminales
Introduzca hasta 3 valores. Los valores elegibles se encuentran entre 2 y 2000. Un valor de 2 elimina la investigación de las interacciones.
Profundidad máxima del árbol
Introduzca hasta 3 valores. Los valores elegibles se encuentran entre 2 y 1000 para representar la profundidad máxima de un árbol. El nodo raíz corresponde a una profundidad de 1. En muchas aplicaciones, las profundidades de 4 a 6 generan modelos razonablemente adecuados.
Número de predictores para la división de nodo
Introduzca hasta 3 valores. Los valores elegibles se encuentran entre 1 y el número total de predictores. En general, el análisis funciona bien cuando se considera el número total de predictores. Sin embargo, algunos conjuntos de datos tienen asociaciones entre los predictores que generan mejor rendimiento del modelo cuando el análisis considera un número menor de predictores para cada nodo.
Número de árboles
Ingrese un valor entre 1 y 5000 para especificar el número máximo de árboles que se generarán. El valor predeterminado de 300 generalmente proporciona resultados útiles para la evaluación de los valores de hiperparámetros.
Si uno o más modelos de interés tienen un número de árboles cercano al número de árboles que especificó, entonces considere si desea incrementar el número de árboles.. Si el número de árboles está más cerca del número máximo, es más probable que un aumento en el número de árboles mejore el rendimiento del modelo.

Regresión logística

Seleccione Resultados del modelo de regresión logística y haga clic en Mostrar resultados para generar los resultados del mejor modelo de regresión logística binaria a partir de la búsqueda del mejor tipo de modelo.

CART®

Seleccione Resultados del modelo CART® y haga clic en Mostrar resultados para generar los resultados para el mejor modelo CART® a partir de la búsqueda del mejor tipo de modelo.