Par défaut, Minitab Statistical Software produit la sortie pour le plus petit arbre dont le coût de mauvais classement se situe à moins d’1 erreur type du coût de mauvais classement le plus faible. Minitab vous permet d'explorer d'autres arbres de la séquence ayant conduit à l'identification de l'arbre optimal. Généralement, vous sélectionnez un arbre alternatif pour l'une des deux raisons suivantes :
- L’arbre optimal fait partie d’un modèle dans lequel les coûts de mauvais classement diminuent. Un ou plusieurs arbres ayant quelques nœuds de plus font partie du même modèle. Généralement, lorsque vous faites des prévisions à partir d'un arbre, il est préférable de bénéficier de la plus grande exactitude possible. Si l’arbre est assez simple, vous pouvez également l’utiliser pour déterminer l’influence de chaque variable de prédiction sur les valeurs de réponse.
- L’arbre optimal fait partie d’un modèle dans lequel les coûts de mauvais classement sont relativement stables. Un ou plusieurs arbres présentant des statistiques récapitulatives similaires pour le modèle ont beaucoup moins de nœuds que l'arbre optimal. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l'effet de chaque variable de prédiction sur les valeurs de réponse. Un arbre plus petit facilite également l'identification de quelques groupes cibles pour effectuer d'autres études. Si la différence dans l'exactitude de prévision pour un arbre plus petit est négligeable, vous pouvez également utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prévision.
Par exemple, dans le diagramme suivant, l’arbre avec 4 nœuds est l’arbre optimal. Les deux arbres les plus grands après celui-ci font partie d’un modèle dans lequel le coût de mauvais classement diminue.
![](/fr-fr/minitab/media/generated-content/images/ctree_example_heart_gcost.PNG)
L’arbre à 7 nœuds présente un coût de mauvais classement inférieur à celui de l’arbre à 4 nœuds. Comme l’arbre à 7 nœuds est de complexité similaire, vous pouvez utiliser le plus grand arbre avec son exactitude de prédiction supplémentaire pour étudier les variables importantes et faire des prédictions.
![](/fr-fr/minitab/media/generated-content/images/ctree_alternative_misclassification_cost.PNG)
En plus des valeurs de critère pour les arbres alternatifs, vous pouvez également comparer la complexité des arbres et l'utilité des différents nœuds. Prenons par exemple les raisons suivantes pour lesquelles un analyste choisit un arbre spécifique qui ne sacrifie pas les performances par rapport à d'autres arbres :
- L'analyste choisit un arbre plus petit qui offre une vue plus claire des variables les plus importantes.
- L'analyse choisit un arbre car les divisions se trouvent sur des variables plus faciles à mesurer que les variables d'un autre arbre.
- L'analyste choisit un arbre en raison d'un nœud terminal spécifique qui l'intéresse.