Por opción predeterminada, Minitab muestra el árbol más pequeño con un costo de clasificación errónea que está dentro de 1 error estándar del costo mínimo.
El nodo raíz es el nodo superior del árbol. Es el único nodo que no tiene padres. En cada nodo, los datos se dividen en 2 hijos, dependiendo de las características de los datos. Por ejemplo, ¿un paciente cardíaco tiene angina por el ejercicio? Los nodos continúan dividiéndose hasta que el árbol se queda sin datos por dividir. En otras palabras, los nodos terminales no se pueden dividir en agrupaciones adicionales.
Cuando se valida el rendimiento del árbol con un conjunto de datos de prueba, el diagrama de árbol muestra los casos del conjunto de datos de entrenamiento.
Las rutas de acceso a los nodos terminales en el diagrama de árbol describen cómo se forman los grupos más puros. Los nodos terminales proporcionan información sobre cómo definir cada grupo más puro con las variables predictoras para su estudio posterior. Cada nodo contiene detalles sobre la clase, el conteo y el porcentaje de la clase.
La información contenida en los nodos terminales también proporciona una manera de clasificar todos los grupos más puros por probabilidades de clase, con el fin de centrar sus esfuerzos.