Tabla de resumen del modelo para Ajustar modelo y Descubrir predictores clave con Clasificación TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Buscar definiciones y orientación para interpretar la tabla de resumen del modelo.
Nota

Minitab muestra los resultados tanto del conjunto de datos de entrenamiento como de prueba. Los resultados de prueba indican si el modelo puede predecir adecuadamente los valores de respuesta para nuevas observaciones o resumir correctamente las relaciones entre la respuesta y las variables predictoras. Utilice los resultados de entrenamiento para evaluar el sobreajuste del modelo.

Total de predictores

El número total de predictores disponibles para el modelo TreeNet®. El total es la suma de los predictores continuos y categóricos que usted especifique.

Predictores importantes

El número de predictores importantes en el modelo TreeNet®. Los predictores importantes tienen puntuaciones de importancia mayores que 0. Puede utilizar la gráfica Importancia relativa de las variables para mostrar el orden de importancia relativa de las variables. Por ejemplo, supongamos que 10 de 20 predictores son importantes en el modelo, la gráfica Importancia relativa de las variables muestra las variables en orden de importancia.

Número de árboles cultivados

Por opción predeterminada, Minitab cultiva 300 árboles CART® pequeños para producir el modelo TreeNet®. Aunque este valor funciona bien para la exploración de los datos, considere cultivar más árboles para producir un modelo final. Para cambiar el número de árboles cultivados, vaya al cuadro de diálogo secundario Opciones.

Número óptimo de árboles

El número óptimo de árboles corresponde al valor más bajo de la log-verosimilitud negativa promedio o de la tasa de clasificación errónea, o al valor más alto del área bajo la curva ROC.

Cuando el número óptimo de árboles esté cerca del número máximo de árboles que el modelo cultiva, considere realizar un análisis con más árboles. Por lo tanto, si cultiva 300 árboles y el número óptimo determinado es 298, vuelva a construir el modelo con más árboles. Si el número óptimo sigue estando cerca del número máximo, continúe aumentando el número de árboles.

Log-verosimilitud promedio

Minitab calcula el promedio de la función de log-verosimilitud negativa cuando la respuesta es binaria. Compare los valores promedio de log-verosimilitud para prueba en diferentes modelos para determinar el modelo con el mejor ajuste. Valores más bajos de log-verosimilitud promedio indica un mejor ajuste.

Área bajo la curva ROC

La curva ROC representa la tasa de verdaderos positivos (TPR), también conocida como potencia, en el eje Y. La curva ROC representa la tasa de falsos positivos (FPR), también conocida como error de tipo 1, en el eje X. El área bajo una curva ROC indica si el modelo es un buen clasificador.

Para los árboles de clasificación, los valores del área bajo la curva ROC normalmente varían de 0.5 a 1. Valores más grandes indican un mejor modelo de clasificación. Cuando el modelo puede separar perfectamente las clases, el área bajo la curva es 1. Cuando el modelo no puede separar las clases mejor que una asignación aleatoria, el área bajo la curva es 0.5.

Elevación

Minitab muestra la elevación cuando la respuesta es binaria. La elevación es la elevación acumulada para el 10% de los datos con la mejor posibilidad de clasificación correcta.

La elevación representa la relación de la respuesta objetivo dividida entre la respuesta promedio. Cuando la elevación es mayor que 1, un segmento de los datos tiene una respuesta mayor que la esperada.

Tasa de clasificación errónea

La tasa óptima de clasificación errónea ocurre en el árbol con el área óptima bajo la curva ROC. La tasa de clasificación errónea indica la frecuencia con la que el modelo clasifica con exactitud los eventos y los no eventos.

Loa valores más pequeños indican mejor rendimiento.