Konfusionsmatrix für CART® Klassifikation

Hier finden Sie Definitionen und Interpretationen für jede Statistik in der Konfusionsmatrix.
Die Konfusionsmatrix veranschaulicht mit Hilfe dieser Metriken, wie gut der Baum die Klassen korrekt trennt:
  • Richtig-Positiv-Rate (TPR): Die Wahrscheinlichkeit, dass ein Ereignisfall richtig prognostiziert wird.
  • Falsch-Positiv-Rate (FPR): Die Wahrscheinlichkeit, dass ein Nicht-Ereignisfall falsch prognostiziert wird.
  • Falsch-Negativ-Rate (FNR): Die Wahrscheinlichkeit, dass ein Ereignisfall falsch prognostiziert wird.
  • Richtig-Negativ-Rate (TNR): Die Wahrscheinlichkeit, dass ein Nicht-Ereignisfall richtig prognostiziert wird.

Interpretation

Konfusionsmatrix



Prognostizierte Klasse
(Trainings)
Prognostizierte Klasse
(Test)
Tatsächliche
Klasse

Anzahl10% Richtig10% Richtig
1 (Ereignis)1391172284,21053475,5
01642214286,62414085,4
Alle30313916485,512917480,9
StatistikTrainings
(%)
Test (%)
Richtig-Positiv-Rate (Empfindlichkeit oder Trennschärfe)84,275,5
Falsch-Positiv-Rate (Fehler 1. Art)13,414,6
Falsch-Negativ-Rate (Fehler 2. Art)15,824,5
Richtig-Negativ-Rate (Spezifität)86,685,4

In diesem Beispiel beträgt die Gesamtzahl der Ja-Ereignisse 139, während die Gesamtzahl der Nein-Ereignisse 164 beträgt.
  • In den Trainingsdaten beträgt die Anzahl der prognostizierten Ja-Ereignisse 117, was zu 84,2 % richtig ist.
  • In den Trainingsdaten beträgt die Anzahl der prognostizierten Nein-Ereignisse 142, was zu 86,6 % richtig ist.
  • In den Testdaten beträgt die Anzahl der prognostizierten Ja-Ereignisse 105, was zu 75,5 % richtig ist.
  • In den Testdaten beträgt die Anzahl der prognostizierten Nein-Ereignisse 140, was zu 80,9 % richtig ist.
Insgesamt beläuft sich %Richtig für die Trainingsdaten auf 85,5 % und für die Testdaten auf 80,9 %.
  • Richtig-Positiv-Rate (TPR): 84,2 % für die Trainingsdaten und 75,5 % für die Testdaten.
  • Falsch-Positiv-Rate (FPR): 13,4 % für die Trainingsdaten und 14,6 % für die Testdaten.