Diagramm der Fläche unterhalb der ROC-Kurve vs. Anzahl der Bäume für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet®-Klassifikation

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Das Diagramm der Fläche unterhalb der ROC-Kurve vs. Anzahl der Bäume zeigt die Fläche unterhalb der ROC-Kurve auf der y-Achse und die Anzahl der Bäume auf der x-Achse. Die Fläche unter einer ROC-Kurve gibt an, ob das Modell ein guter Klassifikator ist. Verwenden Sie die Testergebnisse, um die Fähigkeit des Modells zum Prognostizieren neuer Beobachtungen auszuwerten. Vergleichen Sie die Trainingsergebnisse und die Testergebnisse, um festzustellen, ob es Probleme mit dem Modell in Bezug auf eine übermäßige Anpassung an den Trainingsdatensatz gibt.

Wenn der Maximum-Likelihood-Wert die Anzahl der Bäume für das optimale Modell bestimmt, zeigt Minitab das Diagramm der durchschnittlichen –Log-Likelihood vs. Anzahl der Bäume an. Wenn die minimale Fehlklassifikationsquote die Anzahl der Bäume für das optimale Modell bestimmt, zeigt Minitab das Diagramm der Fehlklassifizierungsrate vs. Anzahl der Bäume an.

Interpretation

Bei Klassifikationsbäumen nimmt die Fläche unter der ROC-Kurve in der Regel Werte von 0,5 bis 1 an. Je größer die Werte, desto besser ist das Klassifikationsmodell. Wenn das Modell die Klassen perfekt trennen kann, entspricht die Fläche unter der Kurve 1. Wenn das Modell die Klassen nicht besser als eine zufällige Einteilung trennen kann, entspricht die Fläche unter der Kurve 0,5.

Die Referenzlinie gibt die optimale Fläche unter der ROC-Kurve für die Testdaten und die Anzahl der Bäume im Modell an.

Im Idealfall steigt die Testkurve mit der Anzahl der Bäume an und erreicht einen Maximalwert, bevor sie abflacht und in einigen Fällen sinkt. Wenn der Maximalwert für die Testkurve nicht ideal ist, versuchen Sie, die Trainingsraten und Fraktionen für die Teilstichproben anzupassen, um die Auswirkungen zu vergleichen.