MAD vs. Anzahl von Bäumen Plotten für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Das Diagramm von MAD vs. Anzahl der Bäume zeigt die mittlere absolute Abweichung (MAD) auf der y-Achse und die Anzahl der Bäume auf der x-Achse. Die mittlere absolute Abweichung gibt an, ob das Modell gut passt. Wenn die Analyse eine Validierungsmethode verwendet, enthält das Diagramm eine Zeile für die Validierungsergebnisse. Nutzen Sie die Validierungsergebnisse, um die Leistung des Modells zu bewerten und neue Beobachtungen vorherzusagen. Vergleichen Sie die Trainingsergebnisse und die Validierungsergebnisse, um zu sehen, ob es Überanpassungsprobleme mit dem Modell für den Trainingsdatensatz gibt.

Diese Analyse baut 5000 Bäume auf. Die optimale Anzahl von Bäumen beträgt 4905. Der optimale Wert für die Testdaten ist etwa 39580, wenn die Anzahl der Bäume 4905 beträgt.

Wenn die Methode des quadrierter Fehler oder die Verlustfunktion die Anzahl der Bäume für das optimale Modell bestimmt, zeigt Minitab das Diagramm von R2 vs. Anzahl der Bäume an.

Interpretation

Je niedriger die MAD-Werte sind, desto besser ist das Modell. Die Referenzlinie gibt den optimalen MAD-Wert für die Validierungsergebnisse und die Anzahl der Bäume im Modell an. Wenn die Kurve der Validierungsergebnisse auf ein unzureichendes Modell hinweist, sollte man überlegen, ob die Analyse mit alternativen Einstellungen wie höheren oder niedrigeren Lernraten oder einem größeren Teilstichprobenanteil erneut versucht werden soll.