Baumdiagramm für CART® Klassifikation

Standardmäßig zeigt Minitab den kleinsten Baum mit Fehlklassifikationskosten an, die innerhalb von 1 Standardfehler der minimalen Kosten liegen.

Klicken Sie mit der rechten Maustaste auf das Baumdiagramm, um die folgenden Vorgänge auszuführen:
  • Markieren Sie die 5 reinsten Knoten. Hierbei handelt es sich um die optimalen Knoten.
  • Kopieren Sie die Werte der Prädiktoren, die zu einem der ausgewählten Knoten führen. Diese Werte sind die Knotenregeln.
  • Rufen Sie die Knotenteilungsansicht auf. Diese Ansicht ist hilfreich, wenn Sie in einem umfangreichen Baum nur feststellen möchten, durch welche Variablen die Knoten geteilt werden.

Der Stammknoten ist der oberste Knoten des Baums. Es ist der einzige Knoten, der keine Elternknoten aufweist. In jedem Knoten werden die Daten entsprechend den Eigenschaften der Daten in zwei Kindknoten geteilt. Beispiel: Leidet ein Herzpatient an belastungsinduzierter Angina? Die Knoten werden weiter geteilt, bis keine teilbaren Daten im Baum mehr vorhanden sind. Mit anderen Worten, die Endknoten können nicht in weitere Gruppen aufgeteilt werden.

Wenn Sie die Leistung des Baums mit einem Testdatensatz validieren, werden im Baumdiagramm Fälle aus dem Trainingsdatensatz angezeigt.

Interpretation

Die Pfade zu den Endknoten im Baumdiagramm beschreiben, wie reinere Gruppen gebildet werden. Die Endknoten liefern Informationen darüber, wie zur weiteren Untersuchung reinere Gruppen mit den Prädiktorvariablen definiert werden können. Jeder Knoten enthält Details zu Klasse, Anzahl und Prozentsatz in der Klasse.

Die in den Endknoten enthaltenen Informationen bieten auch die Möglichkeit, alle reineren Gruppen nach Klassenwahrscheinlichkeiten zu ordnen, um einen Schwerpunkt für Ihre Untersuchungen festzulegen.

Knoten-ID
Gibt die Bezeichnung des Knotens bzw. Endknotens an. Der Endknoten ist ein abschließender Knoten, der nicht weiter geteilt werden kann.
Klasse
Jeder Endknoten verfügt über eine bestimmte Klassenzuweisung, die auf Klassenzuweisungsregeln basiert. Bei einer binären Antwortvariablen könnten die Klassen „Ja“ oder „Nein“ lauten. Für eine multinomiale Antwortvariable könnten die Klassen „Q1“, „Q2“, „Q3“ und „Q4“ vorhanden sein.
Anzahl
Die Anzahl der Fälle in einer bestimmten Klasse.
Prozentsatz
Der Prozentsatz der Fälle in einer bestimmten Klasse.
Gesamtanzahl
Die Summe der Anzahlen in allen Klassen.