Arborescence pour Classification CART®

Par défaut, Minitab affiche le plus petit arbre avec un coût de mauvais classement situé à moins d’une erreur type du coût minimal.

Cliquez sur l’arborescence avec le bouton droit de la souris pour effectuer les interactions suivantes :
  • Mettez en surbrillance les 5 nœuds les plus purs. Ces nœuds sont les nœuds optimaux.
  • Copiez les valeurs des prédicteurs qui mènent à un nœud que vous sélectionnez. Ces valeurs sont les règles du nœud.
  • Affichez la vue de division de nœud. Cette vue est utile lorsque vous avez un grand arbre et que vous voulez uniquement voir quelles variables divisent les nœuds.

Le nœud racine est le nœud supérieur de l’arbre. Il s’agit du seul nœud sans parents. A chaque nœud, les données sont divisées en deux enfants, selon les caractéristiques des données. Par exemple, un patient cardiaque a-t-il une angine de poitrine ? Les nœuds continuent de se diviser jusqu’à ce que l’arbre soit à court de données à diviser. En d’autres termes, les nœuds terminaux ne peuvent pas être divisés en groupements supplémentaires.

Lorsque vous validez les performances de l’arbre avec un jeu de données de test, l’arborescence montre des cas de l’ensemble de données d'apprentissage.

Interprétation

Les chemins vers les nœuds terminaux de l’arborescence décrivent la formation de groupes plus purs. Les nœuds terminaux fournissent des informations sur la façon de définir chaque groupe plus pur avec les variables prédictives pour une étude plus approfondie. Chaque nœud contient des détails sur la classe, le dénombrement et le pourcentage dans la classe.

L’information contenue dans les nœuds terminaux fournit également un moyen de classer tous les groupes plus purs par probabilités de classe, afin de concentrer vos efforts.

ID du nœud
Indique la désignation du nœud ou du nœud terminal. Le nœud terminal est un nœud final qui ne peut pas être divisé davantage.
Classe
Chaque nœud terminal a une affectation de classe spécifique qui dépend des règles d’affectation de classe. Pour une réponse binaire, les classes peuvent être "Oui" ou "Non". Pour une réponse multinomiale, les classes peuvent être "Q1", "Q2", "Q3" et "Q4".
Dénombrement
Le nombre de cas pour une classe spécifique.
Pourcentage
Le pourcentage de cas pour une classe spécifique.
Dénombrement total
La somme des dénombrements pour toutes les classes.