Boxplot der Residuen für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Verwenden Sie das Boxplot der Residuen, um die Gesamtgenauigkeit des Modells auszuwerten. Wenn die Analyse ein Validierungsverfahren verwendet, können Sie auch die Genauigkeit des Modells für die Trainings- und Testdaten vergleichen.

Das Boxplot veranschaulicht die Differenz zwischen den tatsächlichen und den angepassten Werten. Punkte, die um mehr als das 1,5-fache des Interquartilbereichs vom nächstgelegenen Quartil entfernt liegen, verfügen über individuelle Symbole.

Interpretation

Im Idealfall liegen sämtliche Residuen nahe 0, relativ zur Skala der Antwortvariablen. Bei der Verwendung eines Validierungsverfahrens erstellt Minitab separate Diagramme für die Trainings- und die Testdaten. Sie können die Diagramme vergleichen, um die relative Leistung des Modells für die Trainingsdaten und neue Daten zu untersuchen. Sie können auch nach anderen Mustern suchen, die auf einen Unterschied zwischen den Trainings- und Testdaten hinweisen könnten, welcher untersucht werden sollte.

Diese Boxplots zeigen, dass der Interquartilbereich für den Testdatensatz viel größer als für den Trainingsdatensatz ist. Diese Differenz deutet darauf hin, dass die Leistung des Modells für neue Daten schlechter als die des Modells für die Trainingsdaten ist. Die großen Residuen, die von Einzelwertsymbolen dargestellt werden, können zudem darauf hindeuten, dass das Modell für alle Daten gut passend ist.