Nuage de points de la MSE ou du MAD par rapport au nœud terminal pour Régression CART®

Utilisez le nuage de points de la MSE en fonction du nœud terminal ou le nuage de points du MAD en fonction du nœud terminal pour voir les nœuds présentant les valeurs ajustées les moins exactes et les plus exactes. Lorsque l'analyse utilise un ensemble de données de test, vous pouvez comparer le diagramme des données d'apprentissage au diagramme des données de test.

Lorsque la méthode de partition des nœuds est la moindre erreur quadratique, l'axe des Y affiche l'erreur quadratique moyenne (MSE). Lorsque la méthode de partition des nœuds est celle du moindre écart absolu, alors l'axe des Y représente l'écart absolu moyen (MAD). L'axe des X représente les numéros d'identification des nœuds terminaux. Par défaut, les nœuds sont classés de la plus petite quantité d'erreur à la plus grande. Lorsque vous exécutez l'analyse, vous pouvez trouver une option pour trier les nœuds par numéro d'identification en appuyant sur le bouton Graphiques.

Interprétation

Dans l'idéal, si un arbre ajuste bien les données, tous les nœuds ont une petite quantité d'erreur. Il est courant que l'erreur dans certains nœuds soit plus grande que dans d'autres. Les valeurs ajustées des nœuds présentant le moins d'erreur sont celles en lesquelles vous pouvez avoir le plus confiance. Les nœuds ayant la plus grande quantité d'erreur peuvent représenter les meilleures occasions d'améliorer l'arbre en apprenant à réduire la variation ou en trouvant d'autres variables de prévision qui expliquent la variation du nœud.

Lorsque l'analyse utilise un ensemble de données de test, le diagramme inclut des points distincts pour les données d'apprentissage et de test. Les performances de l'arbre sur les données de test représentent généralement mieux les performances de l'arbre pour de nouvelles données. Vous devez étudier les grandes différences d'exactitude des valeurs ajustées entre les données de test et d'apprentissage.

Dans ce graphique, l'exactitude du nœud terminal 8 est pire que pour les autres nœuds terminaux. Vous pouvez avoir relativement plus confiance dans l'exactitude des valeurs ajustées des nœuds présentant des valeurs de MSE inférieures. Les cas dans le nœud terminal 8 peuvent avoir le plus d'occasions d'améliorer l'arbre s'il existe un moyen de réduire ou d'expliquer la variation.