Par défaut, les nœuds sont classés de la plus petite quantité d'erreur à la plus grande. Lorsque vous exécutez l'analyse, vous pouvez trouver une option pour trier les nœuds par numéro d'identification en appuyant sur le bouton Graphiques.
Lorsque l'analyse utilise un ensemble de données de test, le graphique inclut des boîtes à moustaches distinctes pour les données d'apprentissage et de test. Les performances de l'arbre sur les données de test représentent généralement mieux les performances de l'arbre pour de nouvelles données. Vous devez étudier les grandes différences entre les données de test et d'apprentissage.
Dans le graphique suivant, 3 des médianes les plus élevées concernent les nœuds terminaux 17, 16 et 14, qui sont également ceux ayant les plus petites erreurs. Le nœud terminal 1 a la plus petite médiane. Les nœuds terminaux 1 et 3 ont une valeur aberrante chacun, tandis que les autres nœuds terminaux avec des valeurs aberrantes en ont plusieurs. L'erreur pour le nœud terminal 8 est la plus grande.