Minitab affiche un diagramme de valeurs de l'écart absolu moyen (MAD) par rapport au nombre de nœuds terminaux dans l'arbre afin que vous puissiez sélectionner un arbre à évaluer davantage. Si vous utilisez un ensemble de données de test ou une validation croisée sur K partitions pour valider les performances de l'arbre, la valeur de MAD est celle des données de validation.
Le diagramme du MAD par rapport au nombre de nœuds terminaux affiche la valeur de MAD pour chaque arbre. Ce diagramme apparaît lorsque la méthode de partition des nœuds est Moindre écart absolu. Par défaut, l'arbre de régression initial est le plus petit arbre présentant une valeur de MAD située à moins d'1 erreur type de la valeur de MAD minimale. Lorsque l'analyse utilise une validation croisée ou un ensemble de données de test, la valeur de MAD provient de l'échantillon de validation. Les valeurs de l'échantillon de validation se stabilisent généralement et finissent par augmenter à mesure que l'arbre grandit.
Cliquez sur Sélectionner un arbre alternatif pour ouvrir un diagramme interactif qui comprend un tableau de statistiques récapitulatives du modèle. Utilisez le diagramme pour étudier les arbres alternatifs ayant des performances similaires.
Généralement, vous sélectionnez un arbre alternatif pour l'une des deux raisons suivantes :
L'arbre choisi par Minitab fait partie d'un schéma dans lequel le critère s'améliore. Un ou plusieurs arbres ayant quelques nœuds de plus font partie du même modèle. Généralement, lorsque vous faites des prévisions à partir d'un arbre, il est préférable de bénéficier de la plus grande exactitude possible.
L'arbre choisi par Minitab fait partie d'un schéma dans lequel le critère est relativement stable. Un ou plusieurs arbres présentant des statistiques récapitulatives similaires pour le modèle ont beaucoup moins de nœuds que l'arbre optimal. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l'effet de chaque variable de prévision sur les valeurs de réponse. Un arbre plus petit facilite également l'identification de quelques groupes cibles pour effectuer d'autres études. Si la différence dans l'exactitude de prévision pour un arbre plus petit est négligeable, vous pouvez également utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prévision.