Tableau récapitulatif du modèle pour CART® Classification

Trouvez des définitions et des pistes d’interprétation pour le tableau récapitulatif du modèle.
Remarque

Minitab affiche les résultats des ensembles de données d'apprentissage et de test. Les résultats de test indiquent si le modèle peut prédire de manière adaptée les valeurs de réponse pour les nouvelles observations, ou résumer correctement les relations entre les variables de réponse et de prédiction. Les résultats d’apprentissage sont généralement plus idéaux que réels et ne sont donnés qu’à titre de référence.

Cliquez sur Sélectionnez un arbre alternatif pour ouvrir un diagramme interactif qui comprend un tableau de statistiques récapitulatives du modèle. Utilisez le diagramme pour étudier les plus petits arbres ayant des performances similaires.

Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de la façon dont chaque variable de prédiction affecte les valeurs de réponse. Un arbre plus petit facilite également l’identification de quelques groupes cibles pour effectuer d’autres études. Si la différence dans l’exactitude de prédiction pour un arbre plus petit est négligeable, vous pouvez utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prédiction.

Nombre total de prédicteurs

Nombre total de prédicteurs disponibles pour l’arbre de classification. Il s’agit de la somme des prédicteurs continus et de catégorie que vous spécifiez.

Prédicteurs importants

Nombre de prédicteurs importants dans l’arbre de classification. Les prédicteurs importants sont les variables utilisées comme séparateurs principaux ou de substitution.

Interprétation

Vous pouvez utiliser le diagramme d’importance relative des variables pour afficher l’ordre d’importance relative des variables. Par exemple, supposons que 10 des 20 prédicteurs soient importants dans l’arbre de classification, le diagramme d’importance relative des variables affiche les variables dans l’ordre d’importance.

Nombre de nœuds terminaux

Un nœud terminal est un nœud final qui ne peut pas être divisé davantage.

Interprétation

Les nœuds terminaux sont les derniers groupes plus purs identifiés à l’aide de la méthode d’arbre de classification. Vous pouvez utiliser les informations des nœuds terminaux pour faire des prédictions.

Taille minimale des nœuds terminaux

La taille minimale des nœuds terminaux correspond au nœud terminal avec le plus petit nombre de cas.

Interprétation

Par défaut, Minitab définit le nombre minimal de cas autorisés pour un nœud terminal à trois cas ; cependant, votre arbre peut contenir des tailles minimales de nœuds terminaux plus grandes que trois. Vous pouvez également modifier cette valeur de seuil dans la sous-boîte de dialogue Options .

R carré de la somme des carrés des écarts

La somme des carrés des écarts R 2 indique le degré de variation de la réponse expliqué par le modèle. Plus R2 est élevé , plus le modèle est adapté à vos données.

Interprétation

Comparez les valeurs de la somme des carrés des écarts R 2 d’apprentissage et de test. Des valeurs plus élevées de la somme des carrés des écarts R 2 indiquent un meilleur ajustement.

Utilisez la valeur du R carré de la somme des carrés des écarts de test pour évaluer si le modèle est bien ajusté à vos données. Vous pouvez également comparer la valeur du R carré de la somme des carrés des écarts de test avec le R carré de la somme des carrés des écarts de la régression logistique pour déterminer quelle méthode vous donne le meilleur modèle.
Remarque

Le R carré de la somme des carrés des écarts de l’ensemble de données d'apprentissage reflète généralement un résultat d’ajustement du modèle plus optimiste que réel. Minitab affiche les résultats d’apprentissage pour référence.

Moyenne du log de vraisemblance

Minitab calcule la moyenne de la fonction de log de vraisemblance négatif lorsque la réponse est binaire.

Interprétation

Comparez les valeurs moyennes de log de vraisemblance pour le test de différents modèles afin de déterminer celui qui convient le mieux. La valeur moyenne plus faible de log de vraisemblance indique un meilleur ajustement.

Zone située sous la courbe ROC

La courbe ROC représente le taux de vrais positifs (TPR), également appelé puissance, sur l’axe des Y. La courbe ROC représente le taux de faux positifs (FPR), également appelé erreur de type 1, sur l’axe des X. La zone située sous une courbe ROC indique si l’arbre de classification est un bon classificateur.

Interprétation

Pour les arbres de classification, la zone située sous les valeurs de la courbe ROC varie de 0,5 à 1. Lorsqu’un arbre de classification peut parfaitement séparer les classes, la zone située sous la courbe est de 1. Lorsqu’un arbre de classification ne peut pas séparer les classes plus efficacement qu’une affectation aléatoire, la zone située sous la courbe est de 0,5.

Lift

Minitab affiche le lift lorsque la réponse est binaire. Le lift correspond au lift cumulé pour les 10 % des données ayant les meilleures chances de classification correcte.

Interprétation

Le lift représente le rapport de la réponse cible divisée par la réponse moyenne. Lorsque le lift est supérieur à 1, un segment des données a une réponse supérieure à la prédiction.

Coût de mauvais classement

Le coût de mauvais classement est le coût relatif de mauvais classement. Le coût est relatif à un arbre qui prédit le résultat le plus commun pour chaque cas. Le coût relatif tient compte du taux d’erreur et du coût pondéré.

Interprétation

Le coût de mauvais classement sous Test représente le coût de mauvais classement qui se produit à tous les niveaux lorsque Minitab utilise l’arbre dans les résultats au lieu d’un autre arbre pour prédire les valeurs de réponse pour de nouvelles observations. Des valeurs plus faibles indiquent que l’arbre dans les résultats est plus efficace. Les valeurs inférieures à 1 indiquent que le modèle dans les résultats coûte moins cher qu’un modèle qui prédit le résultat le plus commun pour chaque cas.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique