Par défaut, Minitab Statistical Software produit des résultats pour le plus petit arbre où la valeur du critère est située à moins d'1 erreur type de la meilleure valeur. Le critère est soit la moindre erreur quadratique, soit le moindre écart absolu, selon votre choix. Minitab vous permet d'explorer d'autres arbres de la séquence ayant conduit à l'identification de l'arbre optimal. Généralement, vous sélectionnez un arbre alternatif pour l'une des deux raisons suivantes :
- L'arbre choisi par Minitab fait partie d'un schéma dans lequel le critère s'améliore. Un ou plusieurs arbres ayant quelques nœuds de plus font partie du même modèle. Généralement, lorsque vous faites des prévisions à partir d'un arbre, il est préférable de bénéficier de la plus grande exactitude possible.
- L'arbre choisi par Minitab fait partie d'un schéma dans lequel le critère est relativement stable. Un ou plusieurs arbres présentant des statistiques récapitulatives similaires pour le modèle ont beaucoup moins de nœuds que l'arbre optimal. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l'effet de chaque variable de prédiction sur les valeurs de réponse. Un arbre plus petit facilite également l'identification de quelques groupes cibles pour effectuer d'autres études. Si la différence dans l'exactitude de prévision pour un arbre plus petit est négligeable, vous pouvez également utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prédiction.
Par exemple, le diagramme suivant accompagne les résultats sur l'arbre avec 21 nœuds. D'autres arbres de la séquence ont des valeurs de R
2 similaires.
L'arbre à 17 nœuds a une valeur de R
2 presque aussi élevée que l'arbre à 21 nœuds. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l'effet de chaque variable de prédiction sur les valeurs de réponse. Un arbre plus petit facilite également l'identification de quelques groupes cibles pour effectuer d'autres études. Si la réduction de l'exactitude de prévision pour un arbre bien plus petit est négligeable, vous pouvez utiliser l'arbre bien plus petit pour évaluer les relations entre les variables de réponse et de prévision.
En plus des valeurs de critère pour les arbres alternatifs, vous pouvez également comparer la complexité des arbres et l'utilité des différents nœuds. Prenons par exemple les raisons suivantes pour lesquelles un analyste choisit un arbre spécifique qui ne sacrifie pas les performances par rapport à d'autres arbres :
- L'analyste choisit un arbre plus petit qui offre une vue plus claire des variables les plus importantes.
- L'analyse choisit un arbre car les divisions se trouvent sur des variables plus faciles à mesurer que les variables d'un autre arbre.
- L'analyste choisit un arbre en raison d'un nœud terminal spécifique qui l'intéresse.