Tabla de resumen del modelo para Clasificación Random Forests®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Buscar definiciones y orientación para interpretar la tabla de resumen del modelo. Si agrega la validación con un conjunto de prueba a la validación con los datos out-of-bag, Minitab muestra los resultados de ambos métodos de validación.

Total de predictores

El número total de predictores disponibles para el modelo Random Forests®. El total es la suma de los predictores continuos y categóricos que usted especifique.

Predictores importantes

El número de predictores importantes en el modelo Random Forests®. Los predictores importantes tienen puntuaciones de importancia mayores que 0. Puede utilizar la gráfica Importancia relativa de las variables para mostrar el orden de importancia relativa de las variables. Por ejemplo, supongamos que 10 de 20 predictores son importantes en el modelo, la gráfica Importancia relativa de las variables muestra las variables en orden de importancia.

Log-verosimilitud promedio

Minitab calcula el promedio de log-verosimilitud negativa cuando la respuesta es binaria. Compare los valores de log-verosimilitud promedio de diferentes modelos para determinar el modelo con el mejor ajuste. También puede utilizar esta estadística para comparar modelos de otros comandos, como Clasificación CART® y Clasificación TreeNet®. Los valores más bajos de log-verosimilitud promedio indica un mejor ajuste.

Área bajo la curva ROC

La curva ROC representa la tasa de verdaderos positivos (TPR), también conocida como potencia, en el eje Y. La curva ROC representa la tasa de falsos positivos (FPR), también conocida como error de tipo 1, en el eje X. El área bajo una curva ROC indica si el árbol de clasificación es un buen clasificador.

Para los árboles de clasificación, los valores del área bajo la curva ROC normalmente varían de 0.5 a 1. Valores más grandes indican un mejor modelo de clasificación. Cuando el modelo puede separar perfectamente las clases, el área bajo la curva es 1. Cuando el modelo no puede separar las clases mejor que una asignación aleatoria, el área bajo la curva es 0.5.

Elevación

Minitab muestra la elevación cuando la respuesta es binaria. La elevación es la elevación acumulada para el 10% de los datos con la mejor posibilidad de clasificación correcta.

La elevación representa la relación de la respuesta objetivo dividida entre la respuesta promedio. Cuando la elevación es mayor que 1, un segmento de los datos tiene una respuesta mayor que la esperada.

Tasa de clasificación errónea

La tasa de clasificación errónea indica la frecuencia con la que el modelo clasifica con exactitud los eventos y los no eventos. Loa valores más pequeños indican mejor rendimiento.