Konfusionsmatrix für Random Forests^®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Die Konfusionsmatrix veranschaulicht mit Hilfe dieser Metriken, wie gut der Baum die Klassen korrekt trennt:

Richtig-Positiv-Rate (TPR): die Wahrscheinlichkeit, dass ein Ereignisfall richtig prognostiziert wird
Falsch-Positiv-Rate (FPR): die Wahrscheinlichkeit, dass ein Nicht-Ereignisfall falsch prognostiziert wird
Falsch-Negativ-Rate (FNR): die Wahrscheinlichkeit, dass ein Ereignisfall falsch prognostiziert wird
Richtig-Negativ-Rate (TNR): die Wahrscheinlichkeit, dass ein Nicht-Ereignisfall richtig prognostiziert wird

Interpretation

Konfusionsmatrix

	Prognostizierte Klasse (außerhalb des Segments)
Tatsächliche Klasse	Prognostizierte Klasse (außerhalb des Segments)
Tatsächliche Klasse	Anzahl	1	0	% Richtig
1 (Ereignis)	139	109	30	78,42
0	164	26	138	84,15
Alle	303	135	168	81,52

Statistiken	Außerhalb des Segments (%)
Richtig-Positiv-Rate (Empfindlichkeit oder Trennschärfe)	78,42
Falsch-Positiv-Rate (Fehler 1. Art)	15,85
Falsch-Negativ-Rate (Fehler 2. Art)	21,58
Richtig-Negativ-Rate (Spezifität)	84,15

In diesem Beispiel beträgt die Gesamtzahl der 1-Ereignisse 139, während die Gesamtzahl für „0“ 164 beträgt. Die Analyse verwendet Daten von außerhalb des Segments zur Validierung des Modells.

In diesen Daten von außerhalb des Segments beträgt die Gesamtzahl der 1-Ereignisse 139, während die Gesamtzahl für 0-Ergebnisse 164 beträgt.

Die Anzahl der prognostizierten Ereignisse (1) in den Daten von außerhalb des Segments beträgt 109, was 78,42 % richtig ist.
Die Anzahl der prognostizierten Nicht-Ereignisse (0) in den Daten von außerhalb des Segments beträgt 138, was 84,15 % richtig ist.

Insgesamt beträgt der „% Richtig“-Wert für die Daten von außerhalb des Segments 81,52 %. Verwenden Sie die Ergebnisse für die Daten von außerhalb des Segments, um die Prognosegenauigkeit für neue Beobachtungen auszuwerten.

Ein niedriger Wert für „% Richtig“ wird in der Regel durch ein mangelhaft angepasstes Modell verursacht. Verschiedene Probleme führen zu einem mangelhaften Modell. Wenn der „% Richtig“-Wert sehr niedrig ist, überlegen Sie, ob Sie die minimale Anzahl der Fälle zum Teilen eines internen Knotens oder die Anzahl der Prädiktoren ändern möchten, die die Analyse für die Aufteilung eines Knotens berücksichtigt.

Konfusionsmatrix für Random Forests®-Klassifikation

Hinweis

Interpretation

Konfusionsmatrix

Konfusionsmatrix für Random Forests^®-Klassifikation