Methoden und Formeln für das Gain-Diagramm für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet®-Klassifikation

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Das Verfahren für die Punkte im Gain-Diagramm hängt von der Validierungsmethode ab. Für eine multinomiale Antwortvariable zeigt Minitab mehrere Diagramme an, in denen jede Klasse nacheinander als Ereignis behandelt wird.

Keine Validierung

Beim Diagramm für einen Trainingsdatensatz stellt jeder Punkt im Diagramm eine eindeutige angepasste Ereigniswahrscheinlichkeit dar. Die höchste Ereigniswahrscheinlichkeit ist der erste Punkt im Diagramm, der links außen angezeigt wird. Die anderen Punkte im Diagramm werden nach abnehmender Ereigniswahrscheinlichkeit geordnet abgebildet.

Die y-Koordinate des Gain-Diagramms ist die Richtig-Positiv-Rate in einer Prozentskala. Die Berechnung der Richtig-Positiv-Rate erfolgt wie beim ROC-Kurvendiagramm. Die x-Koordinate des Diagramms hat die folgende Form:

Dabei gilt: ist die Anzahl der Zeilen, in denen die angepasste Wahrscheinlichkeit größer als der Schwellenwert, und N ist die Gesamtzahl der Zeilen. Weitere Einzelheiten zu den Schwellenwerten finden Sie unter Methoden und Formeln für die Grenzwertoptimierungskurve (ROC-Kurve) für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet®-Klassifikation.

Separater Testdatensatz

Führen Sie die gleichen Schritte wie beim Trainingsdatensatz aus, berechnen Sie jedoch die Ereigniswahrscheinlichkeiten aus den Fällen für den Testdatensatz.

Test mit Kreuzvalidierung mit K Faltungen

Führen Sie die gleichen Schritte wie beim Verfahren mit dem Trainingsdatensatz aus, berechnen Sie jedoch die Ereigniswahrscheinlichkeiten aus den kreuzvalidierten Fällen.