Efficacité de classement pour Classification CART®

Sélectionnez la méthode ou la formule de votre choix.

Ces statistiques apparaissent dans le tableau montrant l’efficacité de classement des meilleurs et des pires nœuds terminaux. En général, les lignes sont classées en fonction de la taille des probabilités de classe. Les valeurs comprises dans 1E-12 sont de la même grandeur. Minitab trie les nombres de même grandeur en fonction de leurs dénombrements pondérés. Si les dénombrements pondérés sont également de la même grandeur, alors Minitab les trie en fonction de l’ID du nœud.

% de N

La formule suivante donne le pourcentage de données dans le nœud. Cette formule peut être utilisée pour les données sans pondérations :

La formule suivante peut être utilisée pour les données avec pondérations :

Notation

TermeDescription
nombre de cas dans le nœud k
Nnombre de cas dans l’ensemble de données
pondération pour le je cas dans le nœud
pondération pour le ie cas dans l’ensemble de données

Probabilité d’événement et de non-événement

Minitab se réfère à la probabilité d’événement et de non-événement pour les variables de réponse binaires.
La formule suivante donne le pourcentage d’événements dans le nœud. Cette formule peut être utilisée pour les données sans pondérations :

La formule suivante peut être utilisée pour les données avec pondérations :

La probabilité de non-événement est définie comme suit :

Notation

TermeDescription
nombre d’événements dans le nœud k
nombre de cas dans le nœud k
pondération pour le je événement dans le nœud
pondération pour la ie observation dans le nœud

Probabilité de classe et de non-classe

Minitab se réfère à la probabilité de classe et de non-classe pour les variables de réponse multinomiales.
La formule suivante donne le pourcentage pour une classe dans le nœud. Cette formule peut être utilisée pour les données sans pondérations.

La formule suivante peut être utilisée pour les données avec pondérations :

La probabilité de non-classe est définie comme suit :

Notation

TermeDescription
nombre de cas dans une classe y dans le nœud k
nombre de cas dans le nœud k
pondération pour le je cas dans la classe y dans le nœud
pondération pour le ie cas dans le nœud

Probabilités de succès

La formule des probabilités de succès change selon que la variable de réponse est binaire ou multinomiale.

Variable de réponse binaire

Variable de réponse multinomiale