Arborescence pour Régression CART®

Par défaut, Minitab affiche le plus petit arbre présentant une valeur de R2 située à moins d'1 erreur type de la valeur de R2 maximale.

Cliquez sur l'arborescence avec le bouton droit de la souris pour effectuer les interactions suivantes :
  • Mettre en surbrillance les 5 nœuds présentant le moins de variation par rapport à la valeur ajustée pour le nœud. Ces nœuds sont les nœuds optimaux.
  • Mettre en surbrillance les 5 nœuds ayant les moyennes ou les médianes les plus élevées, en fonction du critère de l'arbre.
  • Mettre en surbrillance les 5 nœuds avec les moyennes ou les médianes les plus faibles, en fonction du critère de l'arbre.
  • Copier les valeurs des prédicteurs qui mènent à un nœud que vous sélectionnez. Ces valeurs sont les règles du nœud.
  • Afficher la vue de division de nœud. Cette vue est utile lorsque vous avez un grand arbre et que vous voulez uniquement voir quelles variables divisent les nœuds.

Le nœud racinaire est le nœud supérieur de l'arbre et est le seul nœud qui n'a pas de parents. A chaque nœud, les données sont divisées en 2 enfants, en fonction des caractéristiques des données. Les nœuds continuent de se diviser jusqu'à ce que l'arbre soit à court de données à diviser. En d'autres termes, les nœuds terminaux ne peuvent pas être divisés en groupements supplémentaires.

Lorsque vous vérifiez les performances de l'arbre avec un ensemble de données de test, l'arborescence montre les cas de l'ensemble de données d'apprentissage.

Interprétation

Chaque nœud contient des détails sur la moyenne, l'écart type et le dénombrement.

ID du nœud
Indique la désignation du nœud ou du nœud terminal. Le nœud terminal est un nœud final qui ne peut pas être divisé davantage.
Moyenne
La moyenne est la valeur de réponse moyenne des cas dans le nœud. La moyenne est la valeur prévue pour les nouvelles données qui se trouvent dans le même nœud. Les nœuds terminaux avec des moyennes très différentes des autres nœuds terminaux peuvent être d'un intérêt particulier car les prévisions pour les cas dans ces nœuds terminaux seront très différentes. Par exemple, les moyennes les plus grandes ou les plus petites peuvent être d'un intérêt particulier.
Ecart type
L'écart type est l'écart type des valeurs de réponse dans le nœud. Les nœuds terminaux avec des écarts types plus petits peuvent être d'un intérêt particulier car les prévisions de ces nœuds sont plus précises que pour les nœuds terminaux avec des écarts types plus grands.
Dénombrement total
Le dénombrement total est le nombre de cas dans le nœud. Si l'analyse inclut des pondérations, le dénombrement devient le dénombrement total pondéré. Les nœuds terminaux avec de nombreux cas peuvent être d'un intérêt particulier car ces nœuds représentent généralement des cas plus fréquents.