Gráfica del área bajo la curva ROC vs. número de árboles Ajustar modelo y Descubrir predictores clave con Clasificación TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

La gráfica del área bajo la curva ROC vs. número de árboles muestra el área bajo la curva ROC en el eje Y y el número de árboles en el eje X. El área bajo una curva ROC indica si el modelo es un buen clasificador. Utilice los resultados de prueba para evaluar el rendimiento del modelo para predecir nuevas observaciones. Compare los resultados de entrenamiento y los resultados de prueba para determinar si hay problemas de sobreajuste con el modelo con respecto al conjunto de datos de entrenamiento.

Cuando el valor de máxima verosimilitud determina el número de árboles para el modelo óptimo, Minitab muestra la gráfica de log-verosimilitud promedio vs. número de árboles. Cuando la tasa mínima de clasificación errónea determina el número de árboles para el modelo óptimo, Minitab muestra la gráfica Tasa de clasificación errónea vs. número de árboles.

Interpretación

Para los árboles de clasificación, los valores del área bajo la curva ROC normalmente varían de 0.5 a 1. Valores más grandes indican un mejor modelo de clasificación. Cuando el modelo puede separar perfectamente las clases, el área bajo la curva es 1. Cuando el modelo no puede separar las clases mejor que una asignación aleatoria, el área bajo la curva es 0.5.

La línea de referencia indica el área óptima bajo la curva ROC para los datos de prueba y el número de árboles incluidos en el modelo.

Lo ideal es que la curva de prueba aumente a medida que aumenta el número de árboles y luego alcance un máximo antes de nivelarse o disminuir en algunos casos. Si el máximo de la curva de prueba no es ideal, intente ajustar las tasas de aprendizaje y las fracciones de submuestra para comparar.