Streudiagramm von MSE oder MAD vs. Endknoten für CART® Regression

Verwenden Sie das Streudiagramm von MSE vs. Endknoten oder das Streudiagramm von MAD vs. Endknoten, um die Knoten mit den ungenauesten und den genauesten Anpassungen zu ermitteln. Wenn in der Analyse ein Testdatensatz verwendet wird, können Sie das Diagramm der Trainingsdaten mit dem Diagramm der Testdaten vergleichen.

Wenn die Knotenteilungsmethode der geringste quadrierte Fehler ist, wird auf der y-Achse der mittlere quadrierte Fehler (MSE) angezeigt. Wenn die Knotenteilungsmethode die geringste absolute Abweichung ist, wird auf der y-Achse die mittlere absolute Abweichung (MAD) angezeigt. Auf der x-Achse werden die Identifikationsnummern für die Endknoten angezeigt. In der Standardeinstellung sind die Knoten vom kleinsten bis zum größten Fehler geordnet. Beim Ausführen der Analyse können Sie eine Option zum Sortieren der Knoten nach Identifikationsnummer aufrufen. Klicken Sie dazu auf die Schaltfläche Grafiken.

Interpretation

Im Idealfall, wenn ein Baum gut für die Daten passend ist, weisen alle Knoten einen kleinen Fehlerbetrag auf. Ein gängiges Muster ist, dass der Fehler in einigen Knoten größer als in anderen ist. Die Anpassungen aus den Knoten mit dem geringsten Fehler bieten die größte Gewissheit. Knoten mit dem größten Fehler bieten die besten Möglichkeiten, den Baum zu verbessern. Stellen Sie dazu fest, wie Sie die Streuung verringern können, oder ermitteln Sie weitere Prädiktorvariablen, welche die Streuung im Knoten erklären.

Wenn bei der Analyse ein Testdatensatz verwendet wird, enthält das Diagramm separate Punkte für die Trainings- und die Testdaten. Die Leistung des Baums für die Testdaten stellt in der Regel besser dar, welche Leistung der Baum für neue Daten aufweist. Große Unterschiede zwischen der Genauigkeit der Anpassungen für die Testdaten und die Trainingsdaten sollten untersucht werden.

In diesem Diagramm ist die Genauigkeit von Endknoten 8 schlechter als bei den anderen Endknoten. Bei Knoten mit niedrigeren MSE-Werten können Sie sich hinsichtlich der Genauigkeit der Anpassungen relativ sicherer sein. Die Fälle in Endknoten 8 bieten die beste Möglichkeit zum Verbessern des Baums, wenn es gelingt, die Streuung zu reduzieren oder zu erklären.