Diagramme du R carré par rapport au nombre de nœuds terminaux pour Régression CART®

Minitab affiche un diagramme de la valeur de R2 par rapport au nombre de nœuds terminaux dans l'arbre afin que vous puissiez sélectionner un arbre à évaluer davantage. Si vous utilisez un ensemble de données de test ou une validation croisée sur K partitions pour valider les performances de l'arbre, la valeur de R2 est celle des données de validation.

Le diagramme du R carré par rapport au nombre de nœuds terminaux affiche la valeur de R2 pour chaque arbre. Par défaut, l'arbre de régression initial est le plus petit arbre présentant une valeur de R2 située à moins d'1 erreur type de la valeur de R2 maximale. Lorsque l'analyse utilise une validation croisée ou un ensemble de données de test, la valeur de R2 provient de l'échantillon de validation. Les valeurs de l'échantillon de validation se stabilisent généralement et finissent par diminuer à mesure que l'arbre grandit.

Cliquez sur Sélectionner un arbre alternatif pour ouvrir un diagramme interactif qui comprend un tableau de statistiques récapitulatives du modèle. Utilisez le diagramme pour étudier les arbres alternatifs ayant des performances similaires.

Généralement, vous sélectionnez un arbre alternatif pour l'une des deux raisons suivantes :
  • L'arbre choisi par Minitab fait partie d'un schéma dans lequel le critère s'améliore. Un ou plusieurs arbres ayant quelques nœuds de plus font partie du même modèle. Généralement, lorsque vous faites des prévisions à partir d'un arbre, il est préférable de bénéficier de la plus grande exactitude possible.
  • L'arbre choisi par Minitab fait partie d'un schéma dans lequel le critère est relativement stable. Un ou plusieurs arbres présentant des statistiques récapitulatives similaires pour le modèle ont beaucoup moins de nœuds que l'arbre optimal. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l'effet de chaque variable de prévision sur les valeurs de réponse. Un arbre plus petit facilite également l'identification de quelques groupes cibles pour effectuer d'autres études. Si la différence dans l'exactitude de prévision pour un arbre plus petit est négligeable, vous pouvez également utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prévision.

Interprétation

Principal résultat : Diagramme du R carré par rapport au nombre de nœuds terminaux pour un arbre avec 21 nœuds terminaux

L'arbre de régression avec 21 nœuds terminaux a une valeur de R2 d'environ 0,78. Cet arbre porte l'étiquette "Optimal" car le critère de création de l'arbre était le plus petit arbre présentant une valeur de R2 située à moins d'1 erreur type de la valeur de R2 maximale. Comme ce graphique montre que les valeurs de R2 sont relativement stables entre les arbres ayant environ 20 nœuds et ceux ayant environ 70 nœuds, les chercheurs veulent examiner les performances de certains arbres encore plus petits qui sont similaires à l'arbre dans les résultats. Comparez le graphique suivant pour voir les résultats d'un arbre avec 17 nœuds.

Principal résultat : Diagramme du R carré par rapport au nombre de nœuds terminaux pour un arbre avec 17 nœuds terminaux

L'arbre de régression avec 17 nœuds terminaux a une valeur de R2 de 0,7661. L'arbre des résultats initiaux conserve l'étiquette "Optimal" lorsque vous utilisez Sélectionner un arbre alternatif pour créer des résultats pour un arbre différent.