Boîte à moustaches de réponses par nœud terminal pour Régression CART®

Les boîtes à moustaches fournissent un récapitulatif graphique de la distribution de la variable de réponse dans chaque nœud terminal. Utilisez les boîtes à moustaches pour comparer la forme, la tendance centrale et la variabilité des nœuds. Les boîtes à moustaches sont de meilleures représentations visuelles des valeurs de réponse lorsque le nombre de cas dans un nœud terminal est supérieur à 20.

Interprétation

Par défaut, les nœuds sont classés de la plus petite quantité d'erreur à la plus grande. Lorsque vous exécutez l'analyse, vous pouvez trouver une option pour trier les nœuds par numéro d'identification en appuyant sur le bouton Graphiques.

Lorsque l'analyse utilise un ensemble de données de test, le graphique inclut des boîtes à moustaches distinctes pour les données d'apprentissage et de test. Les performances de l'arbre sur les données de test représentent généralement mieux les performances de l'arbre pour de nouvelles données. Vous devez étudier les grandes différences entre les données de test et d'apprentissage.

Dans le graphique suivant, 3 des médianes les plus élevées concernent les nœuds terminaux 17, 16 et 14, qui sont également ceux ayant les plus petites erreurs. Le nœud terminal 1 a la plus petite médiane. Les nœuds terminaux 1 et 3 ont une valeur aberrante chacun, tandis que les autres nœuds terminaux avec des valeurs aberrantes en ont plusieurs. L'erreur pour le nœud terminal 8 est la plus grande.