Tableau récapitulatif du modèle pour la fonction Classification CART®

Trouvez des définitions et des pistes d’interprétation pour le tableau récapitulatif du modèle.
Remarque

Minitab affiche les résultats des ensembles de données d'apprentissage et de test. Les résultats de test indiquent si le modèle peut prédire de manière adaptée les valeurs de réponse pour les nouvelles observations, ou résumer correctement les relations entre les variables de réponse et de prédiction. Les résultats d’apprentissage sont généralement plus idéaux que réels et ne sont donnés qu’à titre de référence.

Cliquez sur Sélectionner un arbre alternatif pour ouvrir un diagramme interactif qui comprend un tableau de statistiques récapitulatives du modèle. Utilisez le diagramme pour étudier les plus petits arbres ayant des performances similaires.

Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de l'effet de chaque variable de prédiction sur les valeurs de réponse. Un arbre plus petit facilite également l'identification de quelques groupes cibles pour effectuer d'autres études. Si la différence dans l’exactitude de prédiction pour un arbre plus petit est négligeable, vous pouvez utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prédiction.

Nombre total de prédicteurs

Nombre total de prédicteurs disponibles pour l’arbre de classification. Il s’agit de la somme des prédicteurs continus et de catégorie que vous spécifiez.

Prédicteurs importants

Nombre de prédicteurs importants dans l’arbre de classification. Les prédicteurs importants sont les variables utilisées comme séparateurs principaux ou de substitution.

Interprétation

Vous pouvez utiliser le diagramme d'importance relative des variables pour afficher l'ordre d'importance relative des variables. Par exemple, supposons que 10 des 20 prédicteurs soient importants dans l’arbre de classification, le diagramme d’importance relative des variables affiche les variables dans l’ordre d’importance.

Nombre de nœuds terminaux

Un nœud terminal est un nœud final qui ne peut pas être divisé davantage.

Interprétation

Les nœuds terminaux sont les derniers groupes plus purs identifiés à l’aide de la méthode d’arbre de classification. Vous pouvez utiliser les informations des nœuds terminaux pour faire des prévisions.

Taille minimale des nœuds terminaux

La taille minimale des nœuds terminaux correspond au nœud terminal avec le plus petit nombre de cas.

Interprétation

Par défaut, Minitab définit le nombre minimal de cas autorisés pour un nœud terminal à trois cas ; cependant, votre arbre peut contenir des tailles minimales de nœuds terminaux plus grandes que trois. Vous pouvez également modifier cette valeur de seuil dans la sous-boîte de dialogue Options.

Moyenne du log de vraisemblance

Minitab calcule la moyenne de la fonction de log de vraisemblance négatif lorsque la réponse est binaire.

Interprétation

Comparez les valeurs moyennes de log de vraisemblance pour le test de différents modèles afin de déterminer celui qui convient le mieux. La valeur moyenne plus faible de log de vraisemblance indique un meilleur ajustement.

Zone située sous la courbe ROC

La courbe ROC représente le taux de vrais positifs (TPR), également appelé puissance, sur l'axe des Y. La courbe ROC représente le taux de faux positifs (FPR), également appelé erreur de type 1, sur l'axe des X. La zone située sous une courbe ROC indique si l’arbre de classification est un bon classificateur.

Interprétation

Pour les arbres de classification, la zone située sous les valeurs de la courbe ROC varie de 0,5 à 1. Lorsqu’un arbre de classification peut parfaitement séparer les classes, la zone située sous la courbe est de 1. Lorsqu’un arbre de classification ne peut pas séparer les classes plus efficacement qu’une affectation aléatoire, la zone située sous la courbe est de 0,5.

Lift

Minitab affiche le lift lorsque la réponse est binaire. Le lift correspond au lift cumulé pour les 10 % des données ayant les meilleures chances de classification correcte.

Interprétation

Le lift représente le rapport de la réponse cible divisée par la réponse moyenne. Lorsque le lift est supérieur à 1, un segment des données a une réponse supérieure à la prédiction.

Coût de mauvais classement

Le coût de mauvais classement est le coût relatif de mauvais classement. Le coût est relatif à un arbre qui prédit le résultat le plus commun pour chaque cas. Le coût relatif tient compte du taux d’erreur et du coût pondéré.

Interprétation

Le coût de mauvais classement sous Test représente le coût de mauvais classement qui se produit à tous les niveaux lorsque Minitab utilise l’arbre dans les résultats au lieu d’un autre arbre pour prédire les valeurs de réponse pour de nouvelles observations. Des valeurs plus faibles indiquent que l’arbre dans les résultats est plus efficace. Les valeurs inférieures à 1 indiquent que le modèle dans les résultats coûte moins cher qu’un modèle qui prédit le résultat le plus commun pour chaque cas.