Streudiagramm von angepassten Antworten vs. tatsächliche Werte für CART® Regression

Verwenden Sie das Streudiagramm, um die Genauigkeit der Prognosen auszuwerten. Wenn die Analyse ein Validierungsverfahren verwendet, können Sie auch die Genauigkeit des Baums für die Trainings- und Testdaten vergleichen.

Im Streudiagramm werden die tatsächlichen Werte der Antwortvariablen auf der x-Achse und die angepassten Werte der Antwortvariablen auf der y-Achse angezeigt. Die berechnete Linie stellt dar, an welcher Position der tatsächliche Wert und der Wert der Antwortvariablen gleich sind. Ausreißer oder ungewöhnliche Cluster von Punkten in den Testdaten können auf Daten hinweisen, die einer weiteren Untersuchung bedürfen.

Interpretation

Im Idealfall verläuft die Linie durch die Mitte der Punkte, und die Punkte befinden sich dicht an der Linie, relativ zur Skala der Antwortvariablen. Bei der Verwendung eines Validierungsverfahrens erstellt Minitab separate Diagramme für die Trainings- und die Testdaten. Sie können die Diagramme vergleichen, um die relative Leistung des Baums für die Trainingsdaten und neue Daten zu untersuchen. Sie können auch nach anderen Mustern suchen, die auf einen Unterschied zwischen den Trainings- und Testdaten hinweisen könnten, welcher untersucht werden sollte.

In diesem Streudiagramm zeigen die Punkte für den Trainings- und den Testdatensatz ähnliche Muster. Diese Ähnlichkeit deutet darauf hin, dass die Leistung des Baums für neue Daten beinahe der Leistung des Baums für die Trainingsdaten entspricht.