Tabla de resumen del modelo para Cart® Clasificación

Encuentre definiciones y orientación para interpretar la tabla de resumen del modelo.
Nota

Minitab muestra los resultados tanto del conjunto de datos de capacitación como de prueba. Los resultados de la prueba indican si el modelo puede predecir adecuadamente los valores de respuesta para nuevas observaciones o resumir correctamente las relaciones entre la respuesta y las variables predictoras. Los resultados de la capacitación suelen ser más ideales que reales y son solo para referencia.

Haga clic en Seleccionar árbol alternativo para abrir una gráfica interactiva que incluya una tabla de estadísticos de resumen del modelo. Utilice la gráfica para investigar árboles más pequeños con un rendimiento similar.

Normalmente, un árbol con menos nodos terminales proporciona una imagen más clara de cómo cada variable predictora afecta a los valores de respuesta. Un árbol más pequeño también facilita la identificación de algunos grupos objetivo para estudios posteriores. Si la diferencia en la precisión de la predicción de un árbol más pequeño es insignificante, puede utilizar el árbol más pequeño para evaluar las relaciones entre la respuesta y las variables predictoras.

Total de predictores

El número total de predictores disponibles para el árbol de clasificación. Esta es la suma de los predictores continuos y categóricos que especifique.

Predictores importantes

El número de predictores importantes en el árbol de clasificación. Los predictores importantes son las variables que se utilizan como divisores principales o sustitutos.

Interpretación

Puede utilizar la gráfica de importancia relativa de la variable para mostrar el orden de importancia relativa de la variable. Por ejemplo, supongamos que 10 de 20 predictores son importantes en el árbol de clasificación, la gráfica de importancia relativa de la variable muestra las variables en orden de importancia.

Número de nodos terminales

Un nodo terminal es un nodo final que no se puede dividir más.

Interpretación

Los nodos terminales son los grupos más puros finales identificados mediante el método del árbol de clasificación. Puede utilizar la información del nodo terminal para realizar predicciones.

Tamaño mínimo de nodo terminal

El tamaño mínimo de nodo terminal es el nodo terminal con el menor número de casos.

Interpretación

Por opción predeterminada, Minitab establece el número mínimo de casos permitidos para un nodo terminal en 3 casos; sin embargo, su árbol puede tener tamaños mínimos de nodo terminal mayores que 3. También puede cambiar este valor umbral en el cuadro de diálogo secundario Opciones.

R-cuad. de la Desviación

El R 2 de la desviación indica cuánta variación en la respuesta se explica por el modelo. Cuanto mayor sea el R 2, mejor se ajusta el modelo a sus datos.

Interpretación

Compare los valores de R 2 de la desviación de capacitación y de prueba. Mayores valores de R 2 de la desviación indican un mejor ajuste.

Utilice el valor de R-cuadrado de la desviación de prueba para evaluar si el modelo se ajusta bien a sus datos. También puede comparar el valor de R-cuadrado de la desviación de prueba con el R-cuadrado de la desviación de la regresión logística para ver qué método le ofrece el mejor modelo.
Nota

El R-cuadrado de la desviación para el conjunto de datos de capacitación suele reflejar un resultado que se ajusta al modelo que es más optimista que el real. Minitab muestra los resultados de capacitación como referencia.

Logverosimilitud promedio

Minitab calcula el promedio de la función de logverosimilitud negativa cuando la respuesta es binaria.

Interpretación

Compare los valores promedio de logverosimilitud para prueba en diferentes modelos para determinar el modelo con el mejor ajuste. El valor de logverolimilitud promedio inferior indica un mejor ajuste.

Área bajo la curva ROC

La curva ROC traza la tasa de verdaderos positivos (TPR), también conocida como potencia, en el eje Y. La curva ROC traza la tasa de falsos positivos (FPR), también conocida como error de tipo 1, en el eje X. El área bajo una curva ROC indica si el árbol de clasificación es un buen clasificador.

Interpretación

Para los árboles de clasificación, el área bajo los valores de la curva ROC oscila entre 0,5 y 1. Cuando un árbol de clasificación puede separar perfectamente las clases, entonces el área debajo de la curva es 1. Cuando un árbol de clasificación no puede separar las clases mejor que una asignación aleatoria, el área debajo de la curva es 0,5.

Elevación

Minitab muestra elevación cuando la respuesta es binaria. La elevación es la elevación acumulada para el 10% de los datos con la mejor posibilidad de clasificación correcta.

Interpretación

La elevación representa la relación de la respuesta objetivo dividida entre la respuesta promedio. Cuando la elevación es mayor que 1, un segmento de los datos tiene una respuesta mayor que la esperada.

Costo de clasificación errónea

El costo de clasificación errónea es el costo de clasificación errónea relativo. El costo es relativo a un árbol que predice el resultado más común para cada caso. El costo relativo representa la tasa de error y el costo ponderado.

Interpretación

El costo de clasificación errónea en Prueba representa el costo de clasificación errónea que ocurre en todos los niveles cuando Minitab utiliza el árbol de los resultados en lugar de otro árbol para predecir los valores de respuesta para nuevas observaciones. Los valores más pequeños indican que el árbol de los resultados funciona mejor. Los valores menores que 1 indican que el modelo de los resultados cuesta menos que un modelo que predice el resultado más común para cada caso.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política