Minitab Statistical Software produit des résultats pour le modèle avec la meilleure valeur d’un critère d’optimalité. Le critère est soit la moindre erreur quadratique, soit le moindre écart absolu, selon votre choix. Minitab permet d'explorer d'autres modèles de la séquence ayant conduit à l'identification de l'arbre optimal. En règle générale, vous sélectionnez un autre modèle pour l’une des deux raisons suivantes :
- Le modèle sélectionné par l’analyse fait partie d’un modèle où le critère s’améliore. En règle générale, vous souhaitez faire des prédictions à partir d’un modèle avec autant de précision de prédiction que possible.
- Le modèle sélectionné par l’analyse fait partie d’un modèle où le critère est relativement plat. Un ou plusieurs modèles avec des statistiques récapitulatives de modèle similaires ont beaucoup moins de fonctions de base que le modèle optimal. En règle générale, un modèle avec moins de fonctions de base donne une image plus claire de la façon dont chaque variable prédictive affecte les valeurs de réponse. Si la différence de précision de prédiction pour un modèle plus petit est négligeable, vous pouvez utiliser le modèle plus petit pour évaluer les relations entre la réponse et les variables prédictives.
Par exemple, le graphique suivant accompagne les résultats sur le modèle avec 20 fonctions de base. D’autres modèles de la séquence ont des valeurs R
2 similaires.
Le modèle avec 10 fonctions de base a une valeur R
2 qui est presque aussi élevée que le modèle avec 20 fonctions de base. En règle générale, un modèle avec moins de fonctions de base donne une image plus claire de la façon dont chaque variable prédictive affecte les valeurs de réponse. Si la réduction de la précision de la prédiction à partir d’un modèle beaucoup plus petit est négligeable, vous pouvez utiliser le modèle beaucoup plus petit pour évaluer les relations entre la réponse et les variables prédictives.
Outre les valeurs de critère pour les modèles alternatifs, vous pouvez également comparer la complexité des modèles et l’utilité de différentes régions. Considérez les exemples suivants de raisons pour lesquelles un analyste choisit un modèle particulier qui ne sacrifie pas les performances par rapport à d’autres modèles :
- L’analyste choisit un modèle plus petit qui fournit une vision plus claire des variables les plus importantes.
- L’analyse choisit un modèle parce que les fonctions de base sont pour des variables plus faciles à mesurer que les variables d’un autre modèle.
- L’analyste choisit un modèle parce qu’une région particulière des prédicteurs est intéressante.