Diagramm von MAD vs. Anzahl der Bäume für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Das Diagramm von MAD vs. Anzahl der Bäume zeigt die mittlere absolute Abweichung (MAD) auf der y-Achse und die Anzahl der Bäume auf der x-Achse. Die mittlere absolute Abweichung gibt an, ob das Modell gut passt. Verwenden Sie die Testergebnisse, um die Fähigkeit des Modells zum Prognostizieren neuer Beobachtungen auszuwerten. Vergleichen Sie die Trainingsergebnisse und die Testergebnisse, um festzustellen, ob es Probleme mit dem Modell in Bezug auf eine übermäßige Anpassung an den Trainingsdatensatz gibt.

Diese Analyse baut 5000 Bäume auf. Die optimale Anzahl von Bäumen ist 4905. Der optimale Wert für die Testdaten ist etwa 39580, wenn die Anzahl der Bäume 4905 beträgt.

Wenn die Methode des quadrierten Fehlers oder die Verlustfunktion die Anzahl der Bäume für das optimale Modell bestimmt, zeigt Minitab das Diagramm von R2 vs. Anzahl der Bäume an.

Interpretation

Je niedriger die MAD-Werte sind, desto besser ist das Modell. Die Referenzlinie zeigt die optimale MAD für die Testdaten und die Anzahl der Bäume im Modell. Wenn die Testkurve auf ein unzureichendes Modell hindeutet, erwägen Sie, die Analyse mit alternativen Einstellungen noch einmal auszuführen, z. B. mit größeren oder kleineren Trainingsraten oder einer größeren Fraktion für die Teilstichprobe.