R-Quadrat vs. Anzahl der Bäume Anpassen des Modells für und Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Das Diagramm von R-Quadrat vs. Anzahl der Bäume zeigt R2-Werte auf der y-Achse und die Anzahl der Bäume auf der x-Achse. Das R2 gibt an, ob das Modell gut passend ist. Wenn die Analyse eine Validierungsmethode verwendet, enthält das Diagramm eine Zeile für die Validierungsergebnisse. Nutzen Sie die Validierungsergebnisse, um die Leistung des Modells zu bewerten und neue Beobachtungen vorherzusagen. Vergleichen Sie die Trainingsergebnisse und die Validierungsergebnisse, um zu sehen, ob es Überanpassungsprobleme mit dem Modell für den Trainingsdatensatz gibt.

Diese Analyse baut 500 Bäume auf. Die optimale Anzahl von Bäumen beträgt 500. Der R2-Wert für die Kreuzvalidierungsergebnisse, wenn die Anzahl der Bäume 500 beträgt, beträgt ungefähr 86,79 %.

Wenn die Verlustfunktion der absolute Abweichung die Anzahl der Bäume für das optimale Modell bestimmt, zeigt Minitab das Diagramm von MAD vs. Anzahl der Bäume an.

Interpretation

Ein höherer R2-Wert deutet auf ein besseres Modell hin. Die Referenzlinie gibt den optimalen R2-Wert für die Validierungsergebnisse sowie die Anzahl der Bäume im Modell an. Wenn die Kurve der Validierungsergebnisse auf ein unzureichendes Modell hinweist, sollte man überlegen, ob die Analyse mit alternativen Einstellungen wie höheren oder niedrigeren Lernraten oder einem größeren Teilstichprobenanteil erneut versucht werden soll.