Alternativbaum auswählen für CART® Klassifikation

Führen Sie Statistik > Prädiktive Analysen > CART® Klassifikation aus. Klicken Sie auf die Schaltfläche Alternativbaum auswählen für das Diagramm der Fehlklassifikationskosten vs. Anzahl der Endknoten.

Übersicht

In der Standardeinstellung erzeugt die Minitab Statistical Software eine Ausgabe für den kleinsten Baum mit Fehlklassifikationskosten innerhalb von 1 Standardfehler der kleinsten Fehlklassifikationskosten. In Minitab können Sie andere Bäume aus der Sequenz erkunden, die zur Identifizierung des optimalen Baums geführt hat. In der Regel wählen Sie einen Alternativbaum aus einem der beiden folgenden Gründe aus:
  • Der optimale Baum ist Teil eines Musters, bei dem die Fehlklassifikationskosten abnehmen. Ein oder mehrere Bäume mit einigen weiteren Knoten sind Teil desselben Musters. Typischerweise möchten Sie Prognosen anhand eines Baums mit einer möglichst großen Prognosegenauigkeit treffen. Wenn der Baum einfach genug ist, können Sie anhand des Baums auch ein Verständnis der Auswirkung der einzelnen Prädiktorvariablen auf die Werte der Antwortvariablen erlangen.
  • Der optimale Baum ist Teil eines Musters, bei dem die Linie der Fehlklassifikationskosten relativ flach ist. Eine oder mehrere Bäume mit ähnlichen Statistiken zur Zusammenfassung des Modells weisen viel weniger Knoten als der optimale Baum auf. In der Regel liefert ein Baum mit weniger Endknoten ein klareres Bild davon, wie sich die einzelnen Prädiktorvariablen auf die Werte der Antwortvariablen auswirken. Ein kleinerer Baum erleichtert auch das Identifizieren einiger Zielgruppen für weitere Untersuchungen. Wenn für einen kleineren Baum der Unterschied hinsichtlich der Prognosegenauigkeit zu vernachlässigen ist, können Sie außerdem die Beziehungen zwischen der Antwortvariablen und den Prädiktorvariablen anhand des kleineren Baums auswerten.
Im folgenden Diagramm ist z. B. der Baum mit vier Knoten der optimale Baum. Die nächsten zwei größeren Bäume sind Teil eines Musters, bei dem die Fehlklassifikationskosten abnehmen.
Der Baum mit sieben Knoten weist Fehlklassifikationskosten auf, die unter den Kosten für den Baum mit vier Knoten liegen. Da der Baum mit sieben Knoten ähnlich komplex ist, können Sie den größeren Baum mit seiner zusätzlichen Prognosegenauigkeit verwenden, um die wichtigen Variablen zu untersuchen und Prognosen vorzunehmen.
Zusätzlich zu den Kriterienwerten für Alternativbäume können Sie auch die Komplexität der Bäume und die Nützlichkeit verschiedener Knoten vergleichen. Betrachten Sie die folgenden Beispiele für die Gründe, aus denen an Analytiker einen bestimmten Baum auswählt, bei dem die Leistung im Vergleich zu anderen Bäumen nicht beeinträchtigt wird:
  • Der Analytiker wählt einen kleineren Baum aus, der eine klarere Betrachtung der wichtigsten Variablen ermöglicht.
  • Die Analyse wählt einen Baum aus, da die Teilungen bei Variablen erfolgen, die einfacher zu messen sind als die Variablen in einem anderen Baum.
  • Der Analytiker wählt einen Baum aus, da ein bestimmter Endknoten von Interesse ist.

Durchführen der Analyse

Klicken Sie in der Ausgabe auf Alternativbaum auswählen. Es wird ein Dialogfeld geöffnet, das das Diagramm, ein Baumdiagramm und eine Tabelle anzeigt, die den Baum oder den ausgewählten Knoten zusammenfasst.

Auswählen eines Alternativbaums

Das Dialogfeld bietet drei Möglichkeiten zur Auswahl von Alternativbäumen:
  • Klicken Sie auf einen Punkt in der Grafik.
  • Klicken Sie auf die Pfeilschaltflächen unter der Tabelle mit der Zusammenfassung des Modells, um einen Baum auszuwählen, der einen Baum größer oder kleiner als die aktuelle Auswahl ist.
  • Klicken Sie auf eine Schaltfläche, um einen Baum auszuwählen, der eine gängige Auswahl darstellt. Wird bei der Analyse keine Validierung ausgeführt, können die Schaltflächen, die auf den Standardfehler verweisen, nicht verwendet werden.
    Mindestkosten
    Wählen Sie den Baum mit den minimalen Fehlklassifikationskosten aus.
    1 SE Mindestkosten
    Wählen Sie den kleinsten Baum mit Fehlklassifikationskosten innerhalb eines Standardfehlers der Minimalkosten aus.
    2 SE Mindestkosten
    Wählen Sie den kleinsten Baum mit Fehlklassifikationskosten innerhalb von zwei Standardfehlern der Minimalkosten aus.
    Beste ROC
    Wählen Sie den Baum mit der größten Fläche unter der ROC-Kurve aus.

Untersuchen des Baumes und einzelner Knoten

Der Baum ermöglicht die folgenden Aktionen auf der Symbolleiste:
  • Markieren Sie die fünf Knoten mit der größten Reinheit. Hierbei handelt es sich um die optimalen Knoten.
  • Wechseln Sie zwischen der Detaillierter Baum und der Knotenteilungsbaum. Die Knotenteilungsbaum ist hilfreich, wenn Sie in einem umfangreichen Baum nur die Variablen anzeigen möchten, durch welche die Knoten geteilt werden.
  • Vergrößern und verkleinern Sie die Baumanzeige.

Sie können einzelne Knoten im Baum auswählen, um Details zum Knoten in der Tabelle anzuzeigen. Zu den Details zählen Anzahlen der einzelnen Klassen sowie die Gesamtanzahl. Die Details umfassen außerdem die Regeln, die zu einem Knoten geführt haben. Klicken Sie auf Regeln in die Zwischenablage kopieren, damit Sie die Regeln an einer anderen Stelle einfügen können.

Um den gesamten Baum erneut auszuwählen, klicken Sie auf eine beliebige Stelle im Diagramm, die kein individueller Knoten ist.

Erstellen eines neuen Baums

Klicken Sie auf Baum erstellen, um Ergebnisse für den ausgewählten Alternativbaum zu erstellen und zu speichern. Die ausgewählten Optionen für Ergebnisse und Speicherung entsprechen denen für den ursprünglichen Baum. Die Grafiken und Tabellen für den Alternativbaum befinden sich auf einer neuen Registerkarte der Ausgabe. Die gespeicherten Spalten befinden sich im Arbeitsblatt mit den Originaldaten.