Diagrama de árbol para Clasificación CART®

Por opción predeterminada, Minitab muestra el árbol más pequeño con un costo de clasificación errónea que está dentro de 1 error estándar del costo mínimo.

Haga clic con el botón derecho en el diagrama de árbol para realizar las siguientes interacciones:
  • Resalte los 5 nodos más puros. Estos nodos son los nodos óptimos.
  • Copie los valores de los predictores que conducen a un nodo que seleccione. Estos valores son las reglas del nodo.
  • Mostrar la vista de división de nodos. Esta vista es útil cuando tiene un árbol grande y desea ver solo qué variables dividen los nodos.

El nodo raíz es el nodo superior del árbol. Es el único nodo que no tiene padres. En cada nodo, los datos se dividen en 2 hijos, dependiendo de las características de los datos. Por ejemplo, ¿un paciente cardíaco tiene angina por el ejercicio? Los nodos continúan dividiéndose hasta que el árbol se queda sin datos por dividir. En otras palabras, los nodos terminales no se pueden dividir en agrupaciones adicionales.

Cuando se valida el rendimiento del árbol con un conjunto de datos de prueba, el diagrama de árbol muestra los casos del conjunto de datos de entrenamiento.

Interpretación

Las rutas de acceso a los nodos terminales en el diagrama de árbol describen cómo se forman los grupos más puros. Los nodos terminales proporcionan información sobre cómo definir cada grupo más puro con las variables predictoras para su estudio posterior. Cada nodo contiene detalles sobre la clase, el conteo y el porcentaje de la clase.

La información contenida en los nodos terminales también proporciona una manera de clasificar todos los grupos más puros por probabilidades de clase, con el fin de centrar sus esfuerzos.

ID de nodo
Proporciona la designación de nodo o nodo terminal. El nodo terminal es un nodo final que no se puede dividir más.
Clase
Cada nodo terminal tiene una asignación de clase específica basada en reglas de asignación de clases. Para una respuesta binaria, las clases pueden ser "Sí" o "No". Para una respuesta multinomial, las clases pueden ser "Q1", "Q2", "Q3" y "Q4".
Conteo
El número de casos para una clase determinada.
Porcentaje
El porcentaje de casos para una clase determinada.
Conteo total
La suma de los conteos para todas las clases.