Gráfica de costo de clasificación errónea vs. número de nodos terminales para Clasificación CART®

El árbol más exacto es el árbol con el menor costo de clasificación errónea. Este árbol también se conoce como el árbol óptimo.

A veces, los árboles más simples con costos de clasificación errónea ligeramente más altos funcionan igual de bien. Normalmente, un árbol con menos nodos terminales proporciona una imagen más clara de cómo cada variable predictora afecta a los valores de respuesta. Un árbol más pequeño también facilita la identificación de algunos grupos objetivo para estudios posteriores. Si la diferencia en la exactitud de la predicción de un árbol más pequeño es insignificante, puede utilizar el árbol más pequeño para evaluar las relaciones entre la respuesta y las variables predictoras.

Haga clic Seleccionar árbol alternativo para abrir una vista interactiva de la gráfica que incluye una tabla de estadísticas de resumen del modelo. Utilice la gráfica para investigar árboles más pequeños con un rendimiento similar.

Interpretación

En este ejemplo, el árbol con 4 nodos terminales tiene la etiqueta "Óptimo" porque el criterio para la creación del árbol es el árbol más pequeño con un costo de clasificación errónea dentro de 1 error estándar del costo mínimo de clasificación errónea. El árbol con 4 nodos terminales tiene un costo de clasificación errónea de aproximadamente 0.415. El árbol con 6 nodos terminales tiene un costo de clasificación errónea ligeramente inferior de aproximadamente 0.397. El árbol con 7 nodos terminales tiene el costo mínimo de clasificación errónea de aproximadamente 0.391. El árbol inicial con 4 nodos terminales mantiene la etiqueta "Óptimo" cuando se utiliza Seleccionar árbol alternativo para crear resultados para un árbol diferente.