Konfusionsmatrix für Random Forests®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Die Konfusionsmatrix veranschaulicht mit Hilfe dieser Metriken, wie gut der Baum die Klassen korrekt trennt:
  • Richtig-Positiv-Rate (TPR): die Wahrscheinlichkeit, dass ein Ereignisfall richtig prognostiziert wird
  • Falsch-Positiv-Rate (FPR): die Wahrscheinlichkeit, dass ein Nicht-Ereignisfall falsch prognostiziert wird
  • Falsch-Negativ-Rate (FNR): die Wahrscheinlichkeit, dass ein Ereignisfall falsch prognostiziert wird
  • Richtig-Negativ-Rate (TNR): die Wahrscheinlichkeit, dass ein Nicht-Ereignisfall richtig prognostiziert wird

Interpretation

Random Forests®-Klassifikation: Herzkrankhei vs Alter; Rest Blutdru; ...

Konfusionsmatrix Prognostizierte Klasse Tatsächliche (außerhalb des Segments) Klasse Anzahl 1 0 % Richtig 1 (Ereignis) 139 109 30 78,42 0 164 26 138 84,15 Alle 303 135 168 81,52 Außerhalb des Segments Statistiken (%) Richtig-Positiv-Rate (Empfindlichkeit oder Trennschärfe) 78,42 Falsch-Positiv-Rate (Fehler 1. Art) 15,85 Falsch-Negativ-Rate (Fehler 2. Art) 21,58 Richtig-Negativ-Rate (Spezifität) 84,15

In diesem Beispiel beträgt die Gesamtzahl der 1-Ereignisse 139, während die Gesamtzahl für „0“ 164 beträgt. Die Analyse verwendet Daten von außerhalb des Segments zur Validierung des Modells.

In diesen Daten von außerhalb des Segments beträgt die Gesamtzahl der 1-Ereignisse 139, während die Gesamtzahl für 0-Ergebnisse 164 beträgt.
  • Die Anzahl der prognostizierten Ereignisse (1) in den Daten von außerhalb des Segments beträgt 109, was 78,42 % richtig ist.
  • Die Anzahl der prognostizierten Nicht-Ereignisse (0) in den Daten von außerhalb des Segments beträgt 138, was 84,15 % richtig ist.

Insgesamt beträgt der „% Richtig“-Wert für die Daten von außerhalb des Segments 81,52 %. Verwenden Sie die Ergebnisse für die Daten von außerhalb des Segments, um die Prognosegenauigkeit für neue Beobachtungen auszuwerten.

Ein niedriger Wert für „% Richtig“ wird in der Regel durch ein mangelhaft angepasstes Modell verursacht. Verschiedene Probleme führen zu einem mangelhaften Modell. Wenn der „% Richtig“-Wert sehr niedrig ist, überlegen Sie, ob Sie die minimale Anzahl der Fälle zum Teilen eines internen Knotens oder die Anzahl der Prädiktoren ändern möchten, die die Analyse für die Aufteilung eines Knotens berücksichtigt.