Le diagramme du R carré par rapport au nombre de nœuds terminaux affiche la valeur de R2 pour chaque arbre. Par défaut, l'arbre de régression initial est le plus petit arbre présentant une valeur de R2 située à moins d'1 erreur type de la valeur de R2 maximale. Lorsque l'analyse utilise une validation croisée ou un ensemble de données de test, la valeur de R2 provient de l'échantillon de validation. Les valeurs de l'échantillon de validation se stabilisent généralement et finissent par diminuer à mesure que l'arbre grandit.
Cliquez sur Sélectionner un arbre alternatif pour ouvrir un diagramme interactif qui comprend un tableau de statistiques récapitulatives du modèle. Utilisez le diagramme pour étudier les arbres alternatifs ayant des performances similaires.
L'arbre de régression avec 21 nœuds terminaux a une valeur de R2 d'environ 0,78. Cet arbre porte l'étiquette "Optimal" car le critère de création de l'arbre était le plus petit arbre présentant une valeur de R2 située à moins d'1 erreur type de la valeur de R2 maximale. Comme ce graphique montre que les valeurs de R2 sont relativement stables entre les arbres ayant environ 20 nœuds et ceux ayant environ 70 nœuds, les chercheurs veulent examiner les performances de certains arbres encore plus petits qui sont similaires à l'arbre dans les résultats. Comparez le graphique suivant pour voir les résultats d'un arbre avec 17 nœuds.
L'arbre de régression avec 17 nœuds terminaux a une valeur de R2 de 0,7661. L'arbre des résultats initiaux conserve l'étiquette "Optimal" lorsque vous utilisez Sélectionner un arbre alternatif pour créer des résultats pour un arbre différent.