Das Boxplot veranschaulicht die Differenz zwischen den tatsächlichen und den angepasste Werte. Punkte, die um mehr als das 1,5-fache des Interquartilbereichs vom nächstgelegenen Quartil entfernt liegen, verfügen über Symbole für Einzelwerte.
Im Idealfall liegen sämtliche Residuen nahe 0, relativ zur Skala der Antwortvariablen. Wenn Sie eine Validierungstechnik verwenden, erstellt Minitab separate Diagramme für die Trainingsdaten und für die Validierungsergebnisse. Sie können die Diagramme vergleichen, um die relative Leistung des Baums für die Trainingsdaten und neue Daten zu untersuchen. Du kannst auch nach verschiedenen Mustern suchen, die auf einen Unterschied hindeuten könnten, um zwischen den Trainingsdaten und den Validierungsergebnissen zu untersuchen.
Diese Boxplots zeigen ähnliche Ergebnisse für den Trainingsdatensatz und für die Validierungsergebnisse. Diese Ähnlichkeit deutet darauf hin, dass die Leistung des Baums für neue Daten beinahe der Leistung des Baums für die Trainingsdaten entspricht.
Der Interquartilbereich der Boxplots beider Datensätze liegt von etwa –2,6 bis 2,6. 50 % der Daten enthalten Residuen innerhalb dieses Bereichs. Die übrigen Residuen sind größer. Da der Interquartilbereich etwa 5 beträgt, weisen Residuen außerhalb des ungefähren Bereichs von –10,5 bis 10,5 Symbole für Einzelwerte auf. Die größten Residuen liegen in positiver und negativer Richtung annähernd bei 20. Diese großen Residuen können darauf hinweisen, dass der Baum nicht alle Daten gut erfüllt.