Diagramm von R-Quadrat vs. Anzahl der Bäume für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Das Diagramm von R-Quadrat vs. Anzahl der Bäume zeigt R2-Werte auf der y-Achse und die Anzahl der Bäume auf der x-Achse. Das R2 gibt an, ob das Modell gut passend ist. Verwenden Sie die Testergebnisse, um die Fähigkeit des Modells zum Prognostizieren neuer Beobachtungen auszuwerten. Vergleichen Sie die Trainingsergebnisse und die Testergebnisse, um festzustellen, ob es Probleme mit dem Modell in Bezug auf eine übermäßige Anpassung an den Trainingsdatensatz gibt.

Diese Analyse baut 500 Bäume auf. Die optimale Anzahl von Bäumen ist 500. Der R2-Wert für die Testdaten bei einer Anzahl von 500 Bäumen beträgt ca. 86,79%.

Wenn die Verlustfunktion der absoluten Abweichung die Anzahl der Bäume für das optimale Modell bestimmt, zeigt Minitab das Diagramm von MAD vs. Anzahl der Bäume an.

Interpretation

Ein höherer R2-Wert deutet auf ein besseres Modell hin. Die Referenzlinie zeigt das optimale R2 für die Testdaten und die Anzahl der Bäume im Modell. Wenn die Testkurve auf ein unzureichendes Modell hindeutet, erwägen Sie, die Analyse mit alternativen Einstellungen noch einmal auszuführen, z. B. mit größeren oder kleineren Trainingsraten oder einer größeren Fraktion für die Teilstichprobe.