Méthodes et formules pour les mauvais classements dans CART® Classification

Sélectionnez la méthode ou la formule de votre choix.

Le tableau de mauvais classement n’est pas présent lorsque la méthode de partition est la probabilité de classe.

Dénombrement et dénombrement pondéré

Lorsque les pondérations ne sont pas utilisées, les dénombrements et effectifs d’échantillon sont identiques.

Dans le cas pondéré, le dénombrement pondéré est la somme des pondérations d’une catégorie. Lorsque vous avez des pondérations, utilisez les dénombrements pondérés pour calculer les différentes pondérations.

% erreur

Dans le cas pondéré, utilisez les dénombrements pondérés à la place des dénombrements.

Coût

Le calcul du coût change selon que la variable de réponse est binaire ou multinomiale.

Coût = (% erreur × Entrée coût de mauvais classement pour la classe) / 100

Variable de réponse binaire

L’équation suivante donne le coût pour la classe d’événement :

L’équation suivante donne le coût pour la classe de non-événement :

L’équation suivante donne le coût global pour toutes les classes :

Variable de réponse multinomiale

Pour le cas multinomial, l’équation étend la formule de la variable de réponse binaire pour tenir compte de tous les types possibles de mauvais classements. Par exemple, pour une réponse multinomiale avec k classes, le coût de mauvais classement pour Y = 1 est déterminé par l’équation suivante :

L’équation suivante donne le coût global pour le cas multinomial :

Prenons, par exemple, une variable de réponse avec 3 classes et les coûts de mauvais classement suivants :

Classe prévue
Classe réelle 1 2 3
1 0,0 4,1 3,2
2 5,6 0,0 1,1
3 0,4 0,9 0,0

Ensuite, considérez que le tableau suivant donne les pourcentages d’erreur :

Classe prévue
Classe réelle 1 2 3
1 N/A 1 % 0,5 %
2 1,4 % N/A 2,1 %
3 5 % 1,2 % N/A

Enfin, considérez que les classes de la variable de réponse ont les probabilités a priori suivantes :

Les équations suivantes donnent les coûts associés au mauvais classement pour chaque classe dans la variable de réponse :

L’équation suivante donne le coût global :

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique