Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Verwenden Sie das Boxplot der Residuen, um die Gesamtgenauigkeit des Modells auszuwerten. Wenn die Analyse eine Validierungstechnik verwendet, kann man auch die Genauigkeit Modells für die Trainingsdaten und die Validierungsergebnisse vergleichen.

Das Boxplot veranschaulicht die Differenz zwischen den tatsächlichen und den angepasste Werte. Punkte, die um mehr als das 1,5-fache des Interquartilbereichs vom nächstgelegenen Quartil entfernt liegen, verfügen über Symbole für Einzelwerte.

Interpretation

Im Idealfall liegen sämtliche Residuen nahe 0, relativ zur Skala der Antwortvariablen. Wenn die Analyse eine Validierungsmethode verwendet, enthalten die Ergebnisse separate Diagramme für die Trainingsdaten und für die Validierungsergebnisse. Die Leistung des Baums aus den Validierungsergebnissen ist typischerweise eine bessere Darstellung davon, wie sich der Baum für neue Daten entwickelt. Du solltest große Unterschiede zwischen den Validierungsergebnissen und den Trainingsdaten untersuchen.

Diese Boxplots zeigen, dass der IQR für den Testdatensatz viel größer ist als für den Trainingsdatensatz. Diese Differenz deutet darauf hin, dass die Leistung des Modells für neue Daten schlechter als die des Modells für die Trainingsdaten ist. Außerdem können die großen Residuen, die durch einzelne Symbole dargestellt werden, darauf hinweisen, dass das Modell nicht alle Daten gut erfüllt.