Diagramm der Fehlklassifikationskosten vs. Anzahl der Endknoten für CART® Klassifikation

Der genaueste Baum ist der Baum mit den niedrigsten Fehlklassifikationskosten. Ein solcher Baum wird auch als der optimale Baum bezeichnet.

Manchmal funktionieren einfachere Bäume mit etwas höheren Fehlklassifikationskosten genauso gut. In der Regel liefert ein Baum mit weniger Endknoten ein klareres Bild davon, wie sich die einzelnen Prädiktorvariablen auf die Werte der Antwortvariablen auswirken. Ein kleinerer Baum erleichtert auch das Identifizieren einiger Zielgruppen für weitere Untersuchungen. Wenn für einen kleineren Baum der Unterschied hinsichtlich der Prognosegenauigkeit zu vernachlässigen ist, können Sie die Beziehungen zwischen der Antwortvariablen und den Prädiktorvariablen anhand des kleineren Baums auswerten.

Klicken Sie auf Alternativbaum auswählen , um eine interaktive Ansicht des Diagramms zu öffnen, die eine Tabelle mit zusammenfassenden Statistiken zum Modell enthält. Verwenden Sie das Diagramm, um kleinere Bäume mit ähnlicher Leistung zu untersuchen.

Interpretation

In diesem Beispiel hat der Baum mit vier Endknoten die Bezeichnung „Optimal“, da das Kriterium für die Erstellung des Baums der kleinste Baum mit Fehlklassifikationskosten innerhalb von 1 Standardfehler der minimalen Fehlklassifikationskosten ist. Der Baum mit vier Endknoten hat Fehlklassifikationskosten von ca. 0,415. Der Baum mit sechs Endknoten weist etwas niedrigere Fehlklassifikationskosten von etwa 0,397 auf. Der Baum mit sieben Endknoten weist die minimalen Fehlklassifikationskosten von ca. 0,391 auf. Der anfängliche Baum mit vier Endknoten behält die Bezeichnung „Optimal“, wenn Sie mit Alternativbaum auswählen Ergebnisse für einen anderen Baum erstellen.