Sélectionner un arbre alternatif pour CART® Classification

Exécuter Analyse prédictive > CART® Classification. Cliquez sur Sélectionnez un arbre alternatif le bouton pour le Diagramme de coût de maucais classement par rapport au nombre de nœuds terminaux.

Présentation

Par défaut, Minitab Statistical Software produit la sortie pour le plus petit arbre dont le coût de mauvais classement se situe à moins d’1 erreur type du coût de mauvais classement le plus faible. Minitab vous permet d’explorer d’autres arbres de la séquence ayant conduit à l’identification de l’arbre optimal. Généralement, vous sélectionnez un arbre alternatif pour l’une des deux raisons suivantes :
  • L’arbre optimal fait partie d’un modèle dans lequel les coûts de mauvais classement diminuent. Un ou plusieurs arbres ayant quelques nœuds de plus font partie du même modèle. Généralement, lorsque vous faites des prédictions à partir d’un arbre, il est préférable de bénéficier de la plus grande exactitude possible. Si l’arbre est assez simple, vous pouvez également l’utiliser pour déterminer l’influence de chaque variable de prédiction sur les valeurs de réponse.
  • L’arbre optimal fait partie d’un modèle dans lequel les coûts de mauvais classement sont relativement stables. Un ou plusieurs arbres présentant des statistiques récapitulatives similaires pour le modèle ont beaucoup moins de nœuds que l’arbre optimal. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l’effet de chaque variable de prédiction sur les valeurs de réponse. Un arbre plus petit facilite également l’identification de quelques groupes cibles pour effectuer d’autres études. Si la différence dans l’exactitude de prédiction pour un arbre plus petit est négligeable, vous pouvez également utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prédiction.
Par exemple, dans le diagramme suivant, l’arbre avec 4 nœuds est l’arbre optimal. Les deux arbres les plus grands après celui-ci font partie d’un modèle dans lequel le coût de mauvais classement diminue.
L’arbre à 7 nœuds présente un coût de mauvais classement inférieur à celui de l’arbre à 4 nœuds. Comme l’arbre à 7 nœuds est de complexité similaire, vous pouvez utiliser le plus grand arbre avec son exactitude de prédiction supplémentaire pour étudier les variables importantes et faire des prédictions.

Effectuer l’analyse

Cliquez sur Sélectionnez un arbre alternatif dans la sortie. Une boîte de dialogue comprenant le diagramme et un tableau récapitulatif du modèle s’ouvre. La boîte de dialogue fournit trois façons de sélectionner d’autres arbres :
  • Cliquez sur un point sur le graphique.
  • Cliquez sur les flèches sous le tableau récapitulatif du modèle afin de sélectionner un arbre plus grand ou plus petit que la sélection actuelle.
  • Cliquez sur un bouton pour sélectionner un arbre qui est un choix courant. Lorsque l’analyse n’utilise pas de validation, les boutons qui se réfèrent à l’erreur type ne s’appliquent pas.
    Coût min
    Sélectionnez l’arbre avec le coût minimum de mauvais classement
    Coût min pour 1 ET
    Sélectionnez le plus petit arbre dont le coût de mauvais classement se situe à moins d’une erreur type du coût minimum.
    Coût min pour 2 ET
    Sélectionnez le plus petit arbre dont le coût de mauvais classement se situe à moins de 2 erreurs types du coût minimum.
    Meilleur ROC
    Sélectionnez l’arbre ayant la plus grande surface sous la courbe ROC.

Cliquez sur Créer un arbre pour créer et stocker les résultats d’un arbre alternatif que vous choisissez. Les sélections pour les résultats et le stockage sont les mêmes que pour l’arbre d’origine. Les graphiques et les tableaux de l’arbre alternatif se trouvent dans un nouvel onglet de sortie. Les colonnes stockées sont dans la feuille de travail avec les données d’origine.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique