Fehlklassifikationsrate vs. Anzahl der Bäume Plotten für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Der Fehlklassifikationsrate vs. Anzahl der Bäume Plot zeigt die Fehlklassifikationsrate auf der y-Achse und die Anzahl der Bäume auf der x-Achse. Die minimale Fehlklassifikationsrate gibt an, ob das Modell ein guter Klassifikator ist. Wenn die Analyse eine Validierungsmethode verwendet, enthält das Diagramm eine Zeile für die Validierungsergebnisse. Nutzen Sie die Validierungsergebnisse, um die Leistung des Modells zu bewerten und neue Beobachtungen vorherzusagen. Vergleichen Sie die Trainingsergebnisse und die Validierungsergebnisse, um zu sehen, ob es Überanpassungsprobleme mit dem Modell für den Trainingsdatensatz gibt.

Wenn die Fläche unter der ROC-Kurve die Anzahl der Bäume für das optimale Modell bestimmt, zeigt Minitab die Fläche unter ROC-Kurve vs. Anzahl der Bäume an. Wenn der Maximum-Likelihood-Wert die Anzahl der Bäume für das optimale Modell bestimmt, zeigt Minitab das Diagramm der durchschnittlichen –Log-Likelihood vs. Anzahl der Bäume an.

Interpretation

Die Fehlklassifikationsraten müssen ≥ 0 betragen. Je niedriger die Werte, desto besser ist das Klassifikationsmodell. Die Referenzlinie gibt die optimale Fehlklassifikationsrate für die Validierungsergebnisse sowie die Anzahl der Bäume im Modell an. Wenn die Kurve der Validierungsergebnisse auf ein unzureichendes Modell hinweist, sollte man überlegen, ob die Analyse mit alternativen Einstellungen wie höheren oder niedrigeren Lernraten oder einem größeren Teilstichprobenanteil erneut versucht werden soll.