Par défaut, Minitab affiche le plus petit arbre avec un coût de mauvais classement situé à moins d’une erreur type du coût minimal.
Le nœud racine est le nœud supérieur de l’arbre. Il s’agit du seul nœud sans parents. A chaque nœud, les données sont divisées en deux enfants, selon les caractéristiques des données. Par exemple, un patient cardiaque a-t-il une angine de poitrine ? Les nœuds continuent de se diviser jusqu’à ce que l’arbre soit à court de données à diviser. En d’autres termes, les nœuds terminaux ne peuvent pas être divisés en groupements supplémentaires.
Lorsque vous validez les performances de l’arbre avec un jeu de données de test, l’arborescence montre des cas de l’ensemble de données d'apprentissage.
Les chemins vers les nœuds terminaux de l’arborescence décrivent la formation de groupes plus purs. Les nœuds terminaux fournissent des informations sur la façon de définir chaque groupe plus pur avec les variables prédictives pour une étude plus approfondie. Chaque nœud contient des détails sur la classe, le dénombrement et le pourcentage dans la classe.
L’information contenue dans les nœuds terminaux fournit également un moyen de classer tous les groupes plus purs par probabilités de classe, afin de concentrer vos efforts.