Méthodes et formules pour la matrice de confusion dans Ajuster le modèle et Découvrir les prédicteurs principaux avec Classification TreeNet®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Sélectionnez la méthode ou la formule de votre choix.

La matrice de confusion contient des résultats sur l'exactitude de classification du modèle. Dans la plupart des cas, la classification d'une ligne est le niveau de réponse de probabilité prévue la plus élevée. Par exemple, avec une réponse binaire, la classification de la ligne correspond à la catégorie d'événements lorsque la probabilité prévue de l'événement dépasse 0,50. Toutefois, pour une réponse binaire, vous pouvez spécifier un seuil autre que 0,50.

Dénombrement

Lorsqu’il n’y a pas de pondération, les dénombrements et les effectifs d’échantillon sont identiques.

Dénombrement pondéré

Dans le cas pondéré, le dénombrement pondéré est la somme des pondérations d’une catégorie. Utilisez les pondérations pour calculer les pourcentages et les taux. Prenons l'exemple simple suivant :
Niveau de réponse Niveau prévu Pondération
Oui Oui 0,1
Oui Oui 0,2
Oui Non 0,3
Oui Non 0,4
Non Non 0,5
Non Non 0,6
Non Oui 0,7
Non Oui 0,8
Ce tableau donne les statistiques suivantes
Classe réelle Dénombrement pondéré Classe prévue = Oui Classe prévue = Non Pourcentage correct
Oui 0,1 + 0,2 + 0,3 + 0,4 = 1 0,1 + 0,2 = 0,3 0,3 + 0,4 = 0,7 0,3 / (0,3 + 0,7) ×100 = 30,00%
Non 0,5 + 0,6 + 0,7 + 0,8 = 2,6 0,7 + 0,8 = 1,5 0,5 + 0,6 = 1,1 1,1 / (1,5 + 1,1) × 100 = 42,31 %
Toutes 1 + 2,6 = 3,6 0,3 + 1,5 = 1,8 0,7 + 1,1 = 1,8 (0,3 + 1,1) / 3,6 × 100 = 38,89 %

Taux de vrais positifs (sensibilité ou puissance)

Taux de faux positifs (erreur de type I)

Taux de faux négatifs (erreur de type II)

Taux de vrais négatifs (spécificité)

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique