Fläche unter ROC-Kurve vs. Anzahl der Bäume Plot für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Das Diagramm Fläche unter der ROC-Kurve vs. Anzahl der Bäume zeigt die Fläche unter der ROC-Kurve auf der y-Achse sowie die Anzahl der Bäume auf der x-Achse an. Die Fläche unter einer ROC-Kurve gibt an, ob das Modell ein guter Klassifikator ist. Wenn die Analyse eine Validierungsmethode verwendet, enthält das Diagramm eine Zeile für die Validierungsergebnisse. Nutzen Sie die Validierungsergebnisse, um die Leistung des Modells zu bewerten und neue Beobachtungen vorherzusagen. Vergleichen Sie die Trainingsergebnisse und die Validierungsergebnisse, um zu sehen, ob es Überanpassungsprobleme mit dem Modell für den Trainingsdatensatz gibt.

Wenn der Maximum-Likelihood-Wert die Anzahl der Bäume für das optimale Modell bestimmt, zeigt Minitab das Diagramm der durchschnittlichen –Log-Likelihood vs. Anzahl der Bäume an. Wenn die minimale Fehlklassifikationsrate die Anzahl der Bäume für das optimale Modell bestimmt, zeigt Minitab das Diagramm Fehlklassifikationsrate vs. Anzahl der Bäume an.

Interpretation

Bei Klassifikationsbäumen nimmt die Fläche unter der ROC-Kurve in der Regel Werte von 0,5 bis 1 an. Je größer die Werte, desto besser ist das Klassifikationsmodell. Wenn das Modell die Klassen perfekt trennen kann, entspricht die Fläche unter der Kurve 1. Wenn das Modell die Klassen nicht besser als eine zufällige Einteilung trennen kann, entspricht die Fläche unter der Kurve 0,5.

Die Referenzlinie gibt die optimale Fläche unter der ROC-Kurve für die Testdaten und die Anzahl der Bäume im Modell an.

Idealerweise steigt die Kurve für die Validierungsergebnisse, wenn die Anzahl der Bäume steigt, und erreicht dann ein Maximum, bevor sie in manchen Fällen ausgleicht oder abnimmt. Wenn das Maximum für die Kurve der Validierungsergebnisse nicht ideal ist, versuchen Sie, die Lernraten und Subsample-Fraktionen zum Vergleich abzustimmen.