Baumdiagramm für CART® Regression

In der Standardeinstellung zeigt Minitab den kleinsten Baum mit einem R2 innerhalb von einem Standardfehler des maximalen R2 an.

Klicken Sie mit der rechten Maustaste auf das Baumdiagramm, um die folgenden Vorgänge auszuführen:
  • Markieren Sie die fünf Knoten mit der geringsten Streuung vom angepassten Wert für den Knoten. Hierbei handelt es sich um die optimalen Knoten.
  • Markieren Sie die fünf Knoten mit den höchsten Mittelwerten oder Medianen, je nach Kriterium für den Baum.
  • Markieren Sie die fünf Knoten mit den niedrigsten Mittelwerten oder Medianen, je nach Kriterium für den Baum.
  • Kopieren Sie die Werte der Prädiktoren, die zu einem ausgewählten Knoten führen. Diese Werte sind die Knotenregeln.
  • Rufen Sie die Knotenteilungsansicht auf. Diese Ansicht ist hilfreich, wenn Sie in einem umfangreichen Baum nur die Variablen anzeigen möchten, durch welche die Knoten geteilt werden.

Der Wurzelknoten ist der oberste Knoten des Baums und der einzige Knoten, der über keine Elternknoten verfügt. In jedem Knoten werden die Daten entsprechend den Eigenschaften der Daten in zwei Kindknoten geteilt. Die Knoten werden weiter geteilt, bis keine teilbaren Daten im Baum mehr vorhanden sind. Mit anderen Worten, die Endknoten können nicht in weitere Gruppen aufgeteilt werden.

Wenn Sie die Leistung des Baums mit einem Testdatensatz validieren, werden im Baumdiagramm Fälle aus dem Trainingsdatensatz angezeigt.

Interpretation

Jeder Knoten enthält Details zum Mittelwert, zur Standardabweichung und zur Anzahl.

Knoten-ID
Gibt die Bezeichnung des Knotens bzw. Endknotens an. Der Endknoten ist ein abschließender Knoten, der nicht weiter geteilt werden kann.
Mittelwert
Der Mittelwert ist der mittlere Wert der Antwortvariablen für die Fälle im Knoten. Der Mittelwert ist der prognostizierte Wert für neue Daten, die in denselben Knoten fallen. Endknoten mit Mittelwerten, die sich am stärksten von den anderen Endknoten unterscheiden, können von besonderem Interesse sein, da die Prognosen für Fälle in diesen Endknoten am meisten abweichen. So können beispielsweise die größten oder kleinsten Mittelwerte von besonderem Interesse sein.
Standardabweichung
Die Standardabweichung ist die Standardabweichung der Werte der Antwortvariablen im Knoten. Endknoten mit kleineren Standardabweichungen können von besonderem Interesse sein, da die Prognosen auf der Grundlage dieser Knoten genauer sind als bei Endknoten mit größeren Standardabweichungen.
Gesamtanzahl
Die Gesamtanzahl ist die Anzahl der Fälle im Knoten. Wenn die Analyse Gewichtungen enthält, ist die Anzahl die gewichtete Gesamtanzahl. Endknoten mit vielen Fällen können von besonderem Interesse sein, da diese Knoten in der Regel gängigere Fälle darstellen.