Sélectionner un arbre alternatif pour la fonction Régression CART®

Exécutez Stat > Analyse prédictive > Régression CART®. Cliquez sur le bouton Sélectionner un arbre alternatif pour Diagramme du R carré par rapport au nombre de nœuds terminaux ou Diagramme de l'écart absolu moyen par rapport au nombre de nœuds terminaux.

Présentation

Par défaut, Minitab Statistical Software produit des résultats pour le plus petit arbre où la valeur du critère est située à moins d'1 erreur type de la meilleure valeur. Le critère est soit la moindre erreur quadratique, soit le moindre écart absolu, selon votre choix. Minitab vous permet d'explorer d'autres arbres de la séquence ayant conduit à l'identification de l'arbre optimal. Généralement, vous sélectionnez un arbre alternatif pour l'une des deux raisons suivantes :
  • L'arbre choisi par Minitab fait partie d'un schéma dans lequel le critère s'améliore. Un ou plusieurs arbres ayant quelques nœuds de plus font partie du même modèle. Généralement, lorsque vous faites des prévisions à partir d'un arbre, il est préférable de bénéficier de la plus grande exactitude possible.
  • L'arbre choisi par Minitab fait partie d'un schéma dans lequel le critère est relativement stable. Un ou plusieurs arbres présentant des statistiques récapitulatives similaires pour le modèle ont beaucoup moins de nœuds que l'arbre optimal. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l'effet de chaque variable de prédiction sur les valeurs de réponse. Un arbre plus petit facilite également l'identification de quelques groupes cibles pour effectuer d'autres études. Si la différence dans l'exactitude de prévision pour un arbre plus petit est négligeable, vous pouvez également utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prédiction.
Par exemple, le diagramme suivant accompagne les résultats sur l'arbre avec 21 nœuds. D'autres arbres de la séquence ont des valeurs de R2 similaires.
L'arbre à 17 nœuds a une valeur de R2 presque aussi élevée que l'arbre à 21 nœuds. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l'effet de chaque variable de prédiction sur les valeurs de réponse. Un arbre plus petit facilite également l'identification de quelques groupes cibles pour effectuer d'autres études. Si la réduction de l'exactitude de prévision pour un arbre bien plus petit est négligeable, vous pouvez utiliser l'arbre bien plus petit pour évaluer les relations entre les variables de réponse et de prévision.
En plus des valeurs de critère pour les arbres alternatifs, vous pouvez également comparer la complexité des arbres et l'utilité des différents nœuds. Prenons par exemple les raisons suivantes pour lesquelles un analyste choisit un arbre spécifique qui ne sacrifie pas les performances par rapport à d'autres arbres :
  • L'analyste choisit un arbre plus petit qui offre une vue plus claire des variables les plus importantes.
  • L'analyse choisit un arbre car les divisions se trouvent sur des variables plus faciles à mesurer que les variables d'un autre arbre.
  • L'analyste choisit un arbre en raison d'un nœud terminal spécifique qui l'intéresse.

Effectuer l'analyse

Cliquez sur Sélectionner un arbre alternatif dans la sortie. Une boîte de dialogue s'ouvre et affiche le diagramme du critère par rapport au nombre de nœuds terminaux, une arborescence et un tableau qui résume l'arbre ou le nœud sélectionné.

Comparer les critères

La boîte de dialogue fournit trois façons de sélectionner d'autres arbres :
  • Cliquez sur un point sur le graphique.
  • Cliquez sur les flèches situées en bas à droite du graphique afin de sélectionner un arbre plus grand ou plus petit que la sélection actuelle.
  • Cliquez sur un bouton pour sélectionner un arbre qui est un choix courant. Les choix dépendent de si le critère pour l'arbre optimal est la moindre erreur quadratique ou le moindre écart absolu. Lorsque l'analyse n'utilise pas de validation, les boutons qui se réfèrent à l'erreur type ne s'appliquent pas.
    Moindre erreur quadratique
    R carré maximal
    Sélectionnez l'arbre ayant la plus grande valeur de R2 sur le diagramme.
    1-SE R carré max
    Sélectionnez le plus petit arbre avec une valeur de R2 située à moins d'1 erreur type de la plus grande valeur de R2.
    2-SE R carré max
    Sélectionnez le plus petit arbre avec une valeur de R2 située à moins de 2 erreurs types de la plus grande valeur de R2.
    Moindre écart absolu
    MAD min
    Sélectionnez l'arbre avec la plus petite valeur d'écart absolu moyen (MAD) sur le diagramme.
    1-SE MAD
    Sélectionnez le plus petit arbre avec une valeur de MAD située à moins d'1 erreur type de la plus petite valeur de MAD.
    2-SE MAD
    Sélectionnez le plus petit arbre avec une valeur de MAD située à moins de 2 erreurs types de la plus petite valeur de MAD.

Etudier l'arbre et les nœuds

L'arbre permet d'effectuer les interactions suivantes dans la barre d'outils :
  • Mettre en surbrillance les 5 nœuds présentant le moins de variation par rapport à la valeur ajustée pour le nœud. Ces nœuds sont les nœuds optimaux.
  • Mettre en surbrillance les 5 nœuds ayant les moyennes ou les médianes les plus élevées, en fonction du critère de l'arbre.
  • Mettre en surbrillance les 5 nœuds avec les moyennes ou les médianes les plus faibles, en fonction du critère de l'arbre.
  • Passer de Arbre détaillé à Vue de la division des nœuds. L'option Vue de la division des nœuds est utile lorsque vous avez un grand arbre et que vous voulez uniquement voir quelles variables divisent les nœuds.
  • Effectuer un zoom avant et un zoom arrière sur l'arbre.

Vous pouvez sélectionner des nœuds individuels dans l'arbre pour afficher les informations du nœud dans le tableau. Celles-ci incluent la moyenne si le critère est le R2 maximal et la médiane si le critère est le moindre écart absolu. Elles incluent également l'écart type du nœud et les règles pour obtenir le nœud. Cliquez sur Copier les règles dans le presse-papiers pour coller les règles à un autre endroit.

Pour sélectionner à nouveau l'arbre entier, cliquez à tout autre emplacement qu'un nœud individuel dans le diagramme.

Créer un arbre

Cliquez sur Créer un arbre pour créer et stocker les résultats d'un arbre alternatif que vous choisissez. Les sélections pour les résultats et le stockage sont les mêmes que pour l'arbre d'origine. Les graphiques et les tableaux de l'arbre alternatif se trouvent dans un nouvel onglet de sortie. Les colonnes stockées sont dans la feuille de travail avec les données d'origine.