Boxplot der Residuen für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Verwenden Sie das Boxplot der Residuen, um die Gesamtgenauigkeit des Modells auszuwerten. Wenn die Analyse eine Validierungstechnik verwendet, kann man auch die Genauigkeit des Modells für die Trainingsdaten und für die Validierungsergebnisse vergleichen.

Das Boxplot veranschaulicht die Differenz zwischen den tatsächlichen und den angepasste Werte. Punkte, die um mehr als das 1,5-fache des Interquartilbereichs vom nächstgelegenen Quartil entfernt liegen, verfügen über Symbole für Einzelwerte.

Interpretation

Im Idealfall liegen sämtliche Residuen nahe 0, relativ zur Skala der Antwortvariablen. Wenn Sie eine Validierungstechnik verwenden, erstellt Minitab separate Diagramme für die Trainingsdaten und für die Validierungsergebnisse. Sie können die Diagramme vergleichen, um die relative Leistung des Modells für die Trainingsdaten und neue Daten zu untersuchen. Du kannst auch nach verschiedenen Mustern suchen, die auf einen Unterschied hindeuten könnten, um zwischen den Trainingsdaten und den Validierungsergebnissen zu untersuchen.

Diese Boxplots zeigen, dass der IQR für den Testdatensatz viel größer ist als für den Trainingsdatensatz. Diese Differenz deutet darauf hin, dass die Leistung des Modells für neue Daten schlechter als die des Modells für die Trainingsdaten ist. Außerdem können die großen Residuen, die durch einzelne Symbole dargestellt werden, darauf hinweisen, dass das Modell nicht alle Daten gut erfüllt.