Residuendiagramm nach Endknoten angeordnet für CART® Regression

Die Residuen bieten eine grafische Zusammenfassung des Fehlers in jedem Knoten. Das Diagramm erleichtert das Vergleichen der Genauigkeit der Knoten.

Interpretation

Residuen fassen den Fehler in einem Knoten zusammen und können das Identifizieren von Fällen mit schlechter Anpassung erleichtern. Am sichersten können Sie sich bei den Anpassungen von Knoten mit kleinen Residuen relativ zur Skala der Antwortvariablen sein. Knoten mit einer breiteren Streuung von Residuen können Chancen bieten, die Streuung zu verringern oder einen größeren Teil der Streuung zu erklären. Sie können sich entscheiden, Fälle zu untersuchen, die ungewöhnliche Muster aufweisen.

In der Standardeinstellung sind die Knoten vom kleinsten bis zum größten Fehler geordnet. Beim Ausführen der Analyse können Sie eine Option zum Sortieren der Knoten nach Identifikationsnummer aufrufen. Klicken Sie dazu auf die Schaltfläche Grafiken.

Wenn bei der Analyse ein Testdatensatz verwendet wird, enthält die Grafik separate Diagramme für die Trainings- und die Testdaten. Die Leistung des Baums für die Testdaten stellt in der Regel besser dar, welche Leistung der Baum für neue Daten aufweist. Große Unterschiede zwischen den Test- und Trainingsdaten sollten untersucht werden.

Im folgenden Diagramm enthält Endknoten 1 das größte Residuum. Endknoten 13 weist einen Pfad von negativen Residuen auf. Bei einer weiteren Untersuchung dieser Punkte lässt sich möglicherweise der Grund aufdecken, warum der Baum für diese Punkte nicht so gut wie für andere Punkte im Knoten passend ist. Endknoten 17 hat den kleinsten MSE der Endknoten. Die Spannweite der Residuen in Endknoten 17 ist im Vergleich zu den Knoten auf der anderen Seite des Diagramms relativ klein.