Efficacité de classement du meilleur et du pire nœud terminal pour la fonction CART® Classification

Utilisez les valeurs d'efficacité des statistiques d'erreur pour caractériser les nœuds présentant un intérêt particulier en raison de leurs performances.

Minitab affiche un tableau pour chaque niveau de réponse. Chaque ligne du tableau affiche un récapitulatif pour un nœud. Pour les cas binaires et multinomiaux, Minitab trie les probabilités de classe en utilisant l'expression Abs(probabilité d'événement – 0,5). Plus la valeur est élevée, meilleur est le nœud terminal. Les meilleurs nœuds sont classés du meilleur au pire. Les pires nœuds sont classés du pire au meilleur.

En cas de valeurs ex aequo lors de l'utilisation des probabilités de classe, Minitab utilise % de N comme second tri. Le nœud terminal avec le % de N le plus élevé est le premier. S'il existe toujours des valeurs ex aequo après ce tri, Minitab affiche d'abord le plus petit nœud terminal dans les scénarios "Meilleur", "Pire" et "Meilleur et Pire".
Remarque

Le % N le plus élevé est également affiché d'abord dans l'ordre de nœud "Pire". Ainsi, les tris "Meilleur" et "Pire" ne sont pas toujours opposés.

Lorsque vous utilisez un ensemble de données de test, Minitab calcule des statistiques distinctes pour les données d'apprentissage et de test. Vous pouvez comparer les statistiques pour examiner les performances relatives de l'arbre avec les données d'apprentissage et avec de nouvelles données. Les statistiques de test sont généralement une meilleure mesure de la qualité de l'arbre avec de nouvelles données. Les nœuds terminaux pour l'apprentissage et le test sont classés séparément en fonction de la probabilité d'événement de chacun. Les nœuds terminaux qui sont dépourvus d'observations pour les données de test n'ont aucune probabilité d'événement, ces nœuds ne sont donc pas pris en compte.

Nœud terminal
L'identification du nœud terminal.
Dénombrement d'événements ou de classes
Le dénombrement est le nombre de cas dans le nœud pour l'événement ou le non-événement ou pour la classe. Si l'analyse inclut des pondérations, le dénombrement devient le dénombrement pondéré. Les nœuds terminaux avec de nombreux cas peuvent être d'un intérêt particulier car ces nœuds représentent généralement des cas plus fréquents.
Dénombrement total
Le dénombrement total correspond au total des cas d'événements et de non-événements ou au total de tous les dénombrements de classes.
% de N
Le pourcentage des données du nœud.
Probabilité d'événement ou probabilité de classe
La probabilité d'événement est destinée aux variables de réponse binaires et la probabilité de classe est destinée aux variables de réponse multinomiales.
Probabilité de non-événement et probabilité de non-classe
La probabilité de non-événement est destinée aux variables de réponse binaires et la probabilité de non-classe est destinée aux variables de réponse multinomiales.
Probabilités de succès
Les probabilités de succès indiquent le rapport entre la probabilité de l'événement et du non-événement ou entre la probabilité de la classe et de la non-classe.
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique