Par défaut, Minitab affiche l’arborescence la plus petite avec un coût d’erreur de classification inférieur à 1 erreur standard du coût minimum.
Le nœud racine est le nœud supérieur de l’arbre. C’est le seul nœud qui n’a pas de parents. Au niveau de chaque nœud, les données sont divisées en 2 enfants, en fonction des caractéristiques des données. Par exemple, un patient cardiaque souffre-t-il d’angine d’exercice ? Les nœuds continuent à se diviser jusqu’à ce que l’arborescence n’ait plus de données à diviser. En d’autres termes, les nœuds terminaux ne peuvent pas être divisés en d’autres groupes.
Lorsque vous validez les performances de l’arborescence à l’aide d’un ensemble de données de test, le diagramme d’arborescence affiche les cas de l’ensemble de données d’entraînement.
Les chemins d’accès aux nœuds terminaux dans l’arborescence décrivent comment les groupes les plus purs se forment. Les nœuds terminaux fournissent des informations sur la façon de définir chaque groupe plus pur avec les variables prédictives pour une étude plus approfondie. Chaque nœud contient des détails sur la classe, le nombre et le pourcentage dans la classe.
Les informations contenues dans les nœuds terminaux fournissent également un moyen de classer tous les groupes les plus purs par probabilités de classe, afin de concentrer vos efforts.