Methoden und Formeln für das Lift-Diagramm für Random Forests^®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Das Verfahren für die Punkte im Gain-Diagramm hängt von der Validierungsmethode ab. Für eine multinomiale Antwortvariable zeigt Minitab mehrere Diagramme an, in denen jede Klasse nacheinander als Ereignis behandelt wird.

In diesem Thema

Außerhalb des Segments

Für einen bestimmten Baum im Wald ist eine Klassenabstimmung für eine Zeile in den Daten von außerhalb des Segments die prognostizierte Klasse für die Zeile aus dem einzelnen Baum. Die prognostizierte Klasse für eine Zeile von Daten von außerhalb des Segment ist die Klasse mit der höchsten Stimmenanzahl unter allen Bäumen im Wald. Die prognostizierte Klassenwahrscheinlichkeit für eine Zeile in den Daten von außerhalb des Segments ist das Verhältnis zwischen der Anzahl der Stimmen für die Klasse und den Gesamtstimmen für die Zeile.

Beim Diagramm für die Daten von außerhalb des Segments stellt jeder Punkt im Diagramm eine eindeutige prognostizierte Klassenwahrscheinlichkeit dar. Die höchste Ereigniswahrscheinlichkeit ist der erste Punkt im Diagramm, der links außen angezeigt wird. Die anderen Wahrscheinlichkeiten sind absteigend geordnet.

Die y-Koordinate des Gain-Diagramms ist die Richtig-Positiv-Rate in einer Prozentskala. Die Berechnung der Richtig-Positiv-Rate erfolgt wie beim ROC-Kurvendiagramm. Die x-Koordinate des Diagramms hat die folgende Form:

Dabei gilt: ist die Anzahl der Zeilen, in denen die angepasste Wahrscheinlichkeit größer als der Schwellenwert, und N ist die Gesamtzahl der Zeilen. Weitere Einzelheiten zu den Schwellenwerten finden Sie unter Methoden und Formeln für die Grenzwertoptimierungskurve (ROC-Kurve) für Random Forests®-Klassifikation.

Separater Testdatensatz

Führen Sie die gleichen Schritte wie beim Trainingsdatensatz aus, berechnen Sie jedoch die Ereigniswahrscheinlichkeiten aus den Fällen für den Testdatensatz.

Methoden und Formeln für das Lift-Diagramm für Random Forests®-Klassifikation

Hinweis

In diesem Thema

Außerhalb des Segments

Separater Testdatensatz

Methoden und Formeln für das Lift-Diagramm für Random Forests^®-Klassifikation