Minitab zeigt ein Diagramm der mittleren absoluten Abweichungen (MAD) im Vergleich mit der Anzahl der Endknoten im Baum an, sodass Sie einen Baum für weitere Auswertungen auswählen können. Wenn Sie einen Testdatensatz oder eine Kreuzvalidierung mit K Faltungen verwenden, um die Leistung des Baums zu validieren, bezieht sich die MAD auf die Validierungsdaten.
Im Diagramm von MAD vs. Anzahl der Endknoten wird die MAD für jeden Baum angezeigt. Dieses Diagramm wird angezeigt, wenn als Knotenteilungsmethode Geringste absolute Abweichung ausgewählt ist. In der Standardeinstellung ist der anfängliche Regressionsbaum der kleinste Baum mit einer MAD innerhalb von 1 Standardfehler der minimalen MAD. Wenn für die Analyse die Kreuzvalidierung oder ein Testdatensatz verwendet wird, stammt die MAD aus der Validierungsstichprobe. Die Werte für die Validierungsstichprobe flachen in der Regel ab und steigen schließlich mit zunehmender Größe des Baums an.
Klicken Sie auf Alternativbaum auswählen, um ein interaktives Diagramm zu öffnen, das eine Tabelle mit Statistiken zur Zusammenfassung des Modells enthält. Verwenden Sie das Diagramm, um Alternativbäume mit ähnlicher Leistung zu untersuchen.
In der Regel wählen Sie einen Alternativbaum aus einem der beiden folgenden Gründe aus:
Der von Minitab ausgewählte Baum ist Teil eines Musters, bei dem sich das Kriterium verbessert. Ein oder mehrere Bäume mit einigen weiteren Knoten sind Teil desselben Musters. Typischerweise möchten Sie Prognosen anhand eines Baums mit einer möglichst großen Prognosegenauigkeit treffen.
Der von Minitab ausgewählte Baum ist Teil eines Musters, bei dem das Kriterium relativ flach ist. Eine oder mehrere Bäume mit ähnlichen Statistiken zur Zusammenfassung des Modells weisen viel weniger Knoten als der optimale Baum auf. In der Regel liefert ein Baum mit weniger Endknoten ein klareres Bild davon, wie sich die einzelnen Prädiktorvariablen auf die Werte der Antwortvariablen auswirken. Ein kleinerer Baum erleichtert auch das Identifizieren einiger Zielgruppen für weitere Untersuchungen. Wenn für einen kleineren Baum der Unterschied hinsichtlich der Prognosegenauigkeit zu vernachlässigen ist, können Sie außerdem die Beziehungen zwischen der Antwortvariablen und den Prädiktorvariablen anhand des kleineren Baums auswerten.