Konfusionsmatrix für Random Forests®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Die Konfusionsmatrix veranschaulicht mit Hilfe dieser Metriken, wie gut der Baum die Klassen korrekt trennt:
  • Richtig-Positiv-Rate (TPR): die Wahrscheinlichkeit, dass ein Ereignisfall richtig prognostiziert wird
  • Falsch-Positiv-Rate (FPR): die Wahrscheinlichkeit, dass ein Nicht-Ereignisfall falsch prognostiziert wird
  • Falsch-Negativ-Rate (FNR): die Wahrscheinlichkeit, dass ein Ereignisfall falsch prognostiziert wird
  • Richtig-Negativ-Rate (TNR): die Wahrscheinlichkeit, dass ein Nicht-Ereignisfall richtig prognostiziert wird

Interpretation

Konfusionsmatrix


Prognostizierte Klasse
(außerhalb des Segments)
Tatsächliche
Klasse
Anzahl10% Richtig
1 (Ereignis)1391093078,42
01642613884,15
Alle30313516881,52
StatistikenAußerhalb
des
Segments
(%)
Richtig-Positiv-Rate (Empfindlichkeit oder Trennschärfe)78,42
Falsch-Positiv-Rate (Fehler 1. Art)15,85
Falsch-Negativ-Rate (Fehler 2. Art)21,58
Richtig-Negativ-Rate (Spezifität)84,15

In diesem Beispiel beträgt die Gesamtzahl der 1-Ereignisse 139, während die Gesamtzahl für „0“ 164 beträgt. Die Analyse verwendet Daten von außerhalb des Segments zur Validierung des Modells.

In diesen Daten von außerhalb des Segments beträgt die Gesamtzahl der 1-Ereignisse 139, während die Gesamtzahl für 0-Ergebnisse 164 beträgt.
  • Die Anzahl der prognostizierten Ereignisse (1) in den Daten von außerhalb des Segments beträgt 109, was 78,42 % richtig ist.
  • Die Anzahl der prognostizierten Nicht-Ereignisse (0) in den Daten von außerhalb des Segments beträgt 138, was 84,15 % richtig ist.

Insgesamt beträgt der „% Richtig“-Wert für die Daten von außerhalb des Segments 81,52 %. Verwenden Sie die Ergebnisse für die Daten von außerhalb des Segments, um die Prognosegenauigkeit für neue Beobachtungen auszuwerten.

Ein niedriger Wert für „% Richtig“ wird in der Regel durch ein mangelhaft angepasstes Modell verursacht. Verschiedene Probleme führen zu einem mangelhaften Modell. Wenn der „% Richtig“-Wert sehr niedrig ist, überlegen Sie, ob Sie die minimale Anzahl der Fälle zum Teilen eines internen Knotens oder die Anzahl der Prädiktoren ändern möchten, die die Analyse für die Aufteilung eines Knotens berücksichtigt.