Sélectionner un arbre alternatif pour la fonction Classification CART®

Exécutez Stat > Analyse prédictive > Classification CART®. Cliquez sur le bouton Sélectionner un arbre alternatif pour Diagramme de coût de mauvais classement par rapport au nombre de nœuds terminaux.

Généralités

Par défaut, Minitab Statistical Software produit la sortie pour le plus petit arbre dont le coût de mauvais classement se situe à moins d’1 erreur type du coût de mauvais classement le plus faible. Minitab vous permet d'explorer d'autres arbres de la séquence ayant conduit à l'identification de l'arbre optimal. Généralement, vous sélectionnez un arbre alternatif pour l'une des deux raisons suivantes :
  • L’arbre optimal fait partie d’un modèle dans lequel les coûts de mauvais classement diminuent. Un ou plusieurs arbres ayant quelques nœuds de plus font partie du même modèle. Généralement, lorsque vous faites des prévisions à partir d'un arbre, il est préférable de bénéficier de la plus grande exactitude possible. Si l’arbre est assez simple, vous pouvez également l’utiliser pour déterminer l’influence de chaque variable de prédiction sur les valeurs de réponse.
  • L’arbre optimal fait partie d’un modèle dans lequel les coûts de mauvais classement sont relativement stables. Un ou plusieurs arbres présentant des statistiques récapitulatives similaires pour le modèle ont beaucoup moins de nœuds que l'arbre optimal. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l'effet de chaque variable de prédiction sur les valeurs de réponse. Un arbre plus petit facilite également l'identification de quelques groupes cibles pour effectuer d'autres études. Si la différence dans l'exactitude de prévision pour un arbre plus petit est négligeable, vous pouvez également utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prévision.
Par exemple, dans le diagramme suivant, l’arbre avec 4 nœuds est l’arbre optimal. Les deux arbres les plus grands après celui-ci font partie d’un modèle dans lequel le coût de mauvais classement diminue.
L’arbre à 7 nœuds présente un coût de mauvais classement inférieur à celui de l’arbre à 4 nœuds. Comme l’arbre à 7 nœuds est de complexité similaire, vous pouvez utiliser le plus grand arbre avec son exactitude de prédiction supplémentaire pour étudier les variables importantes et faire des prédictions.
En plus des valeurs de critère pour les arbres alternatifs, vous pouvez également comparer la complexité des arbres et l'utilité des différents nœuds. Prenons par exemple les raisons suivantes pour lesquelles un analyste choisit un arbre spécifique qui ne sacrifie pas les performances par rapport à d'autres arbres :
  • L'analyste choisit un arbre plus petit qui offre une vue plus claire des variables les plus importantes.
  • L'analyse choisit un arbre car les divisions se trouvent sur des variables plus faciles à mesurer que les variables d'un autre arbre.
  • L'analyste choisit un arbre en raison d'un nœud terminal spécifique qui l'intéresse.

Effectuer l'analyse

Cliquez sur Sélectionner un arbre alternatif dans la sortie. Une boîte de dialogue s'ouvre et affiche le diagramme, une arborescence et un tableau qui résume l'arbre ou le nœud sélectionné.

Sélectionner un arbre alternatif

La boîte de dialogue fournit trois façons de sélectionner d'autres arbres :
  • Cliquez sur un point sur le graphique.
  • Cliquez sur les flèches sous le tableau récapitulatif du modèle afin de sélectionner un arbre plus grand ou plus petit que la sélection actuelle.
  • Cliquez sur un bouton pour sélectionner un arbre qui est un choix courant. Lorsque l'analyse n'utilise pas de validation, les boutons qui se réfèrent à l'erreur type ne s'appliquent pas.
    Coût min
    Sélectionnez l’arbre avec le coût minimum de mauvais classement
    1-SE coût min
    Sélectionnez le plus petit arbre dont le coût de mauvais classement se situe à moins d’une erreur type du coût minimum.
    2-SE coût min
    Sélectionnez le plus petit arbre dont le coût de mauvais classement se situe à moins de 2 erreurs types du coût minimum.
    Meilleur ROC
    Sélectionnez l’arbre ayant la plus grande surface sous la courbe ROC.

Etudier l'arbre et les nœuds individuels

L'arbre permet d'effectuer les interactions suivantes dans la barre d'outils :
  • Mettre en surbrillance les 5 nœuds ayant le plus de pureté. Ces nœuds sont les nœuds optimaux.
  • Passer de Arbre détaillé à Vue de la division des nœuds. L'option Vue de la division des nœuds est utile lorsque vous avez un grand arbre et que vous voulez uniquement voir quelles variables divisent les nœuds.
  • Effectuer un zoom avant et un zoom arrière sur l'arbre.

Vous pouvez sélectionner des nœuds individuels dans l'arbre pour afficher les informations du nœud dans le tableau. Celles-ci incluent le nombre de classes individuelles et le nombre total, ainsi que les règles pour obtenir le nœud. Cliquez sur Copier les règles dans le presse-papiers pour coller les règles à un autre endroit.

Pour sélectionner à nouveau l'arbre entier, cliquez à tout autre emplacement qu'un nœud individuel dans le diagramme.

Créer un arbre

Cliquez sur Créer un arbre pour créer et stocker les résultats d'un arbre alternatif que vous choisissez. Les sélections pour les résultats et le stockage sont les mêmes que pour l'arbre d'origine. Les graphiques et les tableaux de l'arbre alternatif se trouvent dans un nouvel onglet de sortie. Les colonnes stockées sont dans la feuille de travail avec les données d'origine.