Diagramm von MAD vs. Anzahl der Endknoten für CART® Regression

Minitab zeigt ein Diagramm der mittleren absoluten Abweichungen (MAD) im Vergleich mit der Anzahl der Endknoten im Baum an, sodass Sie einen Baum für weitere Auswertungen auswählen können. Wenn Sie einen Testdatensatz oder eine Kreuzvalidierung mit K Faltungen verwenden, um die Leistung des Baums zu validieren, bezieht sich die MAD auf die Validierungsdaten.

Im Diagramm von MAD vs. Anzahl der Endknoten wird die MAD für jeden Baum angezeigt. Dieses Diagramm wird angezeigt, wenn als Knotenteilungsmethode Geringste absolute Abweichung ausgewählt ist. In der Standardeinstellung ist der anfängliche Regressionsbaum der kleinste Baum mit einer MAD innerhalb von 1 Standardfehler der minimalen MAD. Wenn für die Analyse die Kreuzvalidierung oder ein Testdatensatz verwendet wird, stammt die MAD aus der Validierungsstichprobe. Die Werte für die Validierungsstichprobe flachen in der Regel ab und steigen schließlich mit zunehmender Größe des Baums an.

Klicken Sie auf Alternativbaum auswählen, um ein interaktives Diagramm zu öffnen, das eine Tabelle mit Statistiken zur Zusammenfassung des Modells enthält. Verwenden Sie das Diagramm, um Alternativbäume mit ähnlicher Leistung zu untersuchen.

In der Regel wählen Sie einen Alternativbaum aus einem der beiden folgenden Gründe aus:
  • Der von Minitab ausgewählte Baum ist Teil eines Musters, bei dem sich das Kriterium verbessert. Ein oder mehrere Bäume mit einigen weiteren Knoten sind Teil desselben Musters. Typischerweise möchten Sie Prognosen anhand eines Baums mit einer möglichst großen Prognosegenauigkeit treffen.
  • Der von Minitab ausgewählte Baum ist Teil eines Musters, bei dem das Kriterium relativ flach ist. Eine oder mehrere Bäume mit ähnlichen Statistiken zur Zusammenfassung des Modells weisen viel weniger Knoten als der optimale Baum auf. In der Regel liefert ein Baum mit weniger Endknoten ein klareres Bild davon, wie sich die einzelnen Prädiktorvariablen auf die Werte der Antwortvariablen auswirken. Ein kleinerer Baum erleichtert auch das Identifizieren einiger Zielgruppen für weitere Untersuchungen. Wenn für einen kleineren Baum der Unterschied hinsichtlich der Prognosegenauigkeit zu vernachlässigen ist, können Sie außerdem die Beziehungen zwischen der Antwortvariablen und den Prädiktorvariablen anhand des kleineren Baums auswerten.

Interpretation

Wichtigstes Ergebnis: Diagramm von MAD vs. Anzahl der Endknoten für einen Baum mit 34 Endknoten

Der Regressionsbaum mit 34 Endknoten hat eine MAD von etwa 0,38. Dieser Baum ist mit „Optimal“ beschriftet, da das Kriterium für die Erstellung des Baums der kleinste Baum mit einer Abweichung innerhalb von 1 Standardfehler der geringsten absoluten Abweichung war. Da dieses Diagramm zeigt, dass die MAD-Werte ab Bäumen mit etwa 30 Knoten bis hin zu Bäumen mit etwa 80 Knoten relativ stabil sind, möchten die Forscher die Leistung einiger der noch kleineren Bäume betrachten, die dem Baum in den Ergebnissen ähneln. Betrachten Sie als Vergleich die nächste Grafik mit den Ergebnissen für einen Baum mit 29 Knoten.

Wichtigstes Ergebnis: Diagramm von MAD vs. Anzahl der Endknoten für einen Baum mit 29 Endknoten

Der Regressionsbaum mit 29 Endknoten hat eine MAD von 0,3826. Die Beschriftung „Optimal“ für den Baum aus den anfänglichen Ergebnissen wird beibehalten, wenn Sie Alternativbaum auswählen verwenden, um Ergebnisse für einen anderen Baum zu erstellen.