Im Diagramm von R-Quadrat vs. Anzahl der Endknoten wird das R2 für jeden Baum angezeigt. In der Standardeinstellung ist der anfängliche Regressionsbaum der kleinste Baum mit einem R2 innerhalb von 1 Standardfehler des maximalen R2. Wenn für die Analyse die Kreuzvalidierung oder ein Testdatensatz verwendet wird, stammt das R2 aus der Validierungsstichprobe. Die Werte für die Validierungsstichprobe flachen in der Regel ab und fallen schließlich mit zunehmender Größe des Baums ab.
Klicken Sie auf Alternativbaum auswählen, um ein interaktives Diagramm zu öffnen, das eine Tabelle mit Statistiken zur Zusammenfassung des Modells enthält. Verwenden Sie das Diagramm, um Alternativbäume mit ähnlicher Leistung zu untersuchen.
Der Regressionsbaum mit 21 Endknoten hat ein R2 von etwa 0,78. Dieser Baum ist mit „Optimal“ beschriftet, da das Kriterium für die Erstellung des Baums der kleinste Baum mit einem R2 innerhalb von 1 Standardabweichung des maximalen R2 war. Da dieses Diagramm zeigt, dass die R2-Werte ab Bäumen mit etwa 20 Knoten bis hin zu Bäumen mit etwa 70 Knoten relativ stabil sind, möchten die Forscher die Leistung einiger der noch kleineren Bäume betrachten, die dem Baum in den Ergebnissen ähneln. Betrachten Sie als Vergleich die nächste Grafik mit den Ergebnissen für einen Baum mit 17 Knoten.
Der Regressionsbaum mit 17 Endknoten hat ein R2 von 0,7661. Die Beschriftung „Optimal“ für den Baum aus den anfänglichen Ergebnissen wird beibehalten, wenn Sie Alternativbaum auswählen verwenden, um Ergebnisse für einen anderen Baum zu erstellen.