Diagramme du MAD par rapport au nombre de nœuds terminaux pour Régression CART®

Minitab affiche un diagramme de valeurs de l'écart absolu moyen (MAD) par rapport au nombre de nœuds terminaux dans l'arbre afin que vous puissiez sélectionner un arbre à évaluer davantage. Si vous utilisez un ensemble de données de test ou une validation croisée sur K partitions pour valider les performances de l'arbre, la valeur de MAD est celle des données de validation.

Le diagramme du MAD par rapport au nombre de nœuds terminaux affiche la valeur de MAD pour chaque arbre. Ce diagramme apparaît lorsque la méthode de partition des nœuds est Moindre écart absolu. Par défaut, l'arbre de régression initial est le plus petit arbre présentant une valeur de MAD située à moins d'1 erreur type de la valeur de MAD minimale. Lorsque l'analyse utilise une validation croisée ou un ensemble de données de test, la valeur de MAD provient de l'échantillon de validation. Les valeurs de l'échantillon de validation se stabilisent généralement et finissent par augmenter à mesure que l'arbre grandit.

Cliquez sur Sélectionner un arbre alternatif pour ouvrir un diagramme interactif qui comprend un tableau de statistiques récapitulatives du modèle. Utilisez le diagramme pour étudier les arbres alternatifs ayant des performances similaires.

Généralement, vous sélectionnez un arbre alternatif pour l'une des deux raisons suivantes :
  • L'arbre choisi par Minitab fait partie d'un schéma dans lequel le critère s'améliore. Un ou plusieurs arbres ayant quelques nœuds de plus font partie du même modèle. Généralement, lorsque vous faites des prévisions à partir d'un arbre, il est préférable de bénéficier de la plus grande exactitude possible.
  • L'arbre choisi par Minitab fait partie d'un schéma dans lequel le critère est relativement stable. Un ou plusieurs arbres présentant des statistiques récapitulatives similaires pour le modèle ont beaucoup moins de nœuds que l'arbre optimal. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l'effet de chaque variable de prévision sur les valeurs de réponse. Un arbre plus petit facilite également l'identification de quelques groupes cibles pour effectuer d'autres études. Si la différence dans l'exactitude de prévision pour un arbre plus petit est négligeable, vous pouvez également utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prévision.

Interprétation

Principal résultat : Diagramme du MAD par rapport au nombre de nœuds terminaux pour un arbre avec 34 nœuds terminaux

L'arbre de régression avec 34 nœuds terminaux a une valeur de MAD d'environ 0,38. Cet arbre porte l'étiquette "Optimal" car le critère de création de l'arbre était le plus petit arbre présentant une valeur d'écart située à moins d'1 erreur type de la plus petite valeur d'écart absolu. Comme ce graphique montre que les valeurs de MAD sont relativement stables entre les arbres ayant environ 30 nœuds et ceux ayant environ 80 nœuds, les chercheurs veulent examiner les performances de certains arbres encore plus petits qui sont similaires à l'arbre dans les résultats. Comparez le graphique suivant pour voir les résultats d'un arbre avec 29 nœuds.

Principal résultat : Diagramme du MAD par rapport au nombre de nœuds terminaux pour un arbre avec 29 nœuds terminaux

L'arbre de régression avec 29 nœuds terminaux a une valeur de MAD de 0,3826. L'arbre des résultats initiaux conserve l'étiquette "Optimal" lorsque vous utilisez Sélectionner un arbre alternatif pour créer des résultats pour un arbre différent.