Área bajo la curva ROC frente al número de árboles que trazan para Ajustar modelo y Descubrir predictores clave con Clasificación TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.

La gráfica Área bajo la curva ROC vs. número de árboles muestra el área bajo la curva ROC en el eje Y y el número de árboles en el eje X. El área bajo una curva ROC indica si el modelo es un buen clasificador. Cuando el análisis utiliza un método de validación, el gráfico incluye una línea para los resultados de la validación. Utiliza los resultados de la validación para evaluar el rendimiento del modelo y predecir nuevas observaciones. Compare los resultados de entrenamiento y los resultados de validación para determinar si hay problemas de sobreajuste con el modelo con respecto al conjunto de datos de entrenamiento.

Cuando el valor de máxima verosimilitud determina el número de árboles para el modelo óptimo, Minitab muestra la gráfica Log-verosimilitud promedio vs. número de árboles. Cuando la tasa mínima de clasificación errónea determina el número de árboles para el modelo óptimo, Minitab muestra la gráfica Tasa de clasificaciones erróneas vs. número de árboles.

Interpretación

Para los árboles de clasificación, los valores del área bajo la curva ROC normalmente varían de 0.5 a 1. Valores más grandes indican un mejor modelo de clasificación. Cuando el modelo puede separar perfectamente las clases, el área bajo la curva es 1. Cuando el modelo no puede separar las clases mejor que una asignación aleatoria, el área bajo la curva es 0.5.

La línea de referencia indica el área óptima bajo la curva ROC para los datos de prueba y el número de árboles incluidos en el modelo.

Idealmente, la curva para los resultados de validación aumenta a medida que aumenta el número de árboles y luego alcanza un máximo antes de nivelarse o disminuir en algunos casos. Si el máximo para la curva de los resultados de validación no es ideal, intenta ajustar las tasas de aprendizaje y las fracciones de submuestreo para comparar.