Matrice de confusion pour Classification Random Forests®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

La matrice de confusion montre la capacité de l’arbre à séparer correctement les classes avec ces mesures :
  • Taux de vrais positifs (TPR) — probabilité qu'un cas d'événement soit prédit correctement
  • Taux de faux positifs (FPR) — probabilité qu’un cas de non-événement soit prédit de façon incorrecte
  • Taux de faux négatifs (FNR) — probabilité qu’un cas d’événement soit prédit de façon incorrecte
  • Taux de vrais négatifs (TNR) — probabilité qu’un cas de non-événement soit prédit correctement

Interprétation

Random Forests® Classification: Maladies car vs Âge; Pression art; ...

Matrice de confusion Catégorie prévue (Out-of-Bag) Classe réelle Dénombrement Oui Non % correct Oui (Événement) 139 109 30 78,42 Non 164 26 138 84,15 Tous 303 135 168 81,52 Out-of-Bag Statistiques (%) Taux de vrai positif (sensibilité ou puissance) 78,42 Taux de faux positif (erreur de type I) 15,85 Taux de faux négatif (erreur de type II) 21,58 Taux de vrai négatif (spécificité) 84,15

Dans cet exemple, le nombre total d'événements Oui est de 139, et le nombre total d'événements Non est de 164. L’analyse utilise des données out-of-bag pour valider le modèle.

Dans les données out-of-bag, le nombre total d'événements Oui est de 139, et le nombre total d'événements Non est de 164.
  • Le nombre d’événements prévus (Oui) dans les données out-of-bag est de 109, ce qui est correct à 78,42 %.
  • Le nombre de non-événements prévus (Non) dans les données out-of-bag est de 138, ce qui est correct à 84,15 %.

Dans l’ensemble, le %Correct pour les données out-of-bag est de 81,52%. Utilisez les résultats des données out-of-bag pour évaluer l'exactitude de la prévision pour les nouvelles observations.

Un % Correct de valeur faible est généralement dû à un modèle ajusté déficient. Divers problèmes conduisent à un modèle déficient. Si le % Correct est très faible, voyez s’il y a lieu de modifier le nombre minimum de cas pour diviser un nœud interne ou de modifier le nombre de prédicteurs que l’analyse prend en compte pour le fractionnement d’un nœud.