Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.
Minitab muestra los resultados tanto de los datos de entrenamiento como de los resultados de validación. Los resultados de validación indican si el modelo puede predecir adecuadamente los valores de respuesta para nuevas observaciones o resumir correctamente las relaciones entre la respuesta y las variables predictoras. Utilice los resultados de entrenamiento para evaluar el sobreajuste del modelo.
El número total de predictores disponibles para el modelo TreeNet®. El total es la suma de los predictores continuos y categóricos que usted especifique.
El número de predictores importantes en el modelo TreeNet®. Los predictores importantes tienen puntuaciones de importancia mayores que 0. Puede utilizar la gráfica Importancia relativa de las variables para mostrar el orden de importancia relativa de las variables. Por ejemplo, supongamos que 10 de 20 predictores son importantes en el modelo, la gráfica Importancia relativa de las variables muestra las variables en orden de importancia.
Por opción predeterminada, Minitab cultiva 300 árboles CART® pequeños para producir el modelo TreeNet®. Aunque este valor funciona bien para la exploración de los datos, considere cultivar más árboles para producir un modelo final. Para cambiar el número de árboles cultivados, vaya al cuadro de diálogo secundario Opciones.
El número óptimo de árboles corresponde al valor más bajo de la probabilidad logarítmica negativa media o de la clasificación errónea, o al valor más alto del área bajo la curva ROC.
Cuando el número óptimo de árboles esté cerca del número máximo de árboles que el modelo cultiva, considere realizar un análisis con más árboles. Por lo tanto, si cultiva 300 árboles y el número óptimo determinado es 298, vuelva a construir el modelo con más árboles. Si el número óptimo sigue estando cerca del número máximo, continúe aumentando el número de árboles.
Minitab calcula el promedio de la función de log-verosimilitud negativa cuando la respuesta es binaria. Comparar los valores medios –log-verosimilitud para los resultados de validación de diferentes modelos para determinar el modelo con el mejor ajuste. Valores más bajos de log-verosimilitud promedio indica un mejor ajuste.
La curva ROC representa la tasa de positivos verdaderos (TPR), también conocida como potencia, en el eje Y. La curva ROC representa la tasa de positivos falsos (FPR), también conocida como error de tipo 1, en el eje X. El área bajo una curva ROC indica si el modelo es un buen clasificador.
Para los árboles de clasificación, los valores del área bajo la curva ROC normalmente varían de 0.5 a 1. Valores más grandes indican un mejor modelo de clasificación. Cuando el modelo puede separar perfectamente las clases, el área bajo la curva es 1. Cuando el modelo no puede separar las clases mejor que una asignación aleatoria, el área bajo la curva es 0.5.
Minitab muestra la elevación cuando la respuesta es binaria. La elevación es la elevación acumulada para el 10% de los datos con la mejor posibilidad de clasificación correcta.
La elevación representa la relación de la respuesta objetivo dividida entre la respuesta promedio. Cuando la elevación es mayor que 1, un segmento de los datos tiene una respuesta mayor que la esperada.
La tasa óptima de clasificaciones erróneas ocurre en el árbol con el área óptima bajo la curva ROC. La tasa de clasificaciones erróneas indica la frecuencia con la que el modelo clasifica con exactitud los eventos y los no eventos.
Valores más pequeños indican mejor rendimiento.