Auswählen der Analyseoptionen für CART® Klassifikation

Statistik > Prädiktive Analysen > CART® Klassifikation > Optionen

Wählen Sie die Analyseoptionen aus.

Knotenteilungsmethode
Wählen Sie die Teilungsmethode aus, um den Entscheidungsbaum zu generieren. Sie können die Ergebnisse aus mehreren Teilungsmethoden vergleichen, um die beste Option für Ihre Anwendung zu ermitteln.
  • Gini: Die Gini-Methode ist die Standardmethode. Die Gini-Methode funktioniert gut in vielen Anwendungen. Mit der Gini-Methode werden in der Regel Bäume generiert, die kleine Knoten mit einer hohen Konzentration der als relevant erachteten Werte der Antwortvariablen enthalten.
  • Entropie: Die Entropiemethode ist proportional zum Maximum bestimmter Wahrscheinlichkeitsfunktionen für den Knoten.
  • Twoing: Die Twoing-Methode ist nur bei einer multinomialen Antwortvariablen verfügbar. Die Twoing-Methode generiert in der Regel ausgewogenere Teilungen als die Gini-Methode oder die Entropie-Methode. Bei einer binären Antwortvariablen entspricht die Twoing-Methode der Gini-Methode.
  • Klassenwahrscheinlichkeit: Der Wahrscheinlichkeitsbaum ist tendenziell größer als der Gini-Baum. Verwenden Sie die Wahrscheinlichkeitsmethode, wenn Sie an der Leistung einiger der oberen Knoten interessiert sind.
Kriterium für Auswahl des optimalen Baums
Treffen Sie eine Auswahl unter den folgenden Kriterien, um den Baum in den Ergebnissen auszuwählen. Sie können die Ergebnisse aus verschiedenen Bäumen vergleichen, um die beste Option für Ihre Anwendung zu ermitteln.
  • Minimale Fehlklassifikationskosten: Wählen Sie diese Option aus, um Ergebnisse für den Baum anzuzeigen, welcher die Fehlklassifikationskosten minimiert.
  • Innerhalb von K Standardfehlern der minimalen Fehlklassifikationskosten; K=: Wählen Sie diese Option aus, um Ergebnisse für den kleinsten Baum mit Fehlklassifikationskosten innerhalb von K Standardfehlern der minimalen Fehlklassifikationskosten anzuzeigen. Standardmäßig ist K=1; daher gelten die Ergebnisse für den kleinsten Baum mit Fehlklassifikationskosten innerhalb von 1 Standardfehler des Baums mit den minimalen Fehlklassifikationskosten.
Anzahl der Surrogate für einen Prädiktor mit fehlenden Werten
Geben Sie die Anzahl der Surrogate ein, nach denen Minitab sucht, wenn ein Prädiktor fehlende Werte aufweist. Wenn viele Prädiktoren ähnliche Muster fehlender Werte aufweisen, empfiehlt es sich, die Anzahl der Surrogate zu erhöhen.
Diese Zahl stellt die maximale Anzahl von Surrogaten dar, nach denen Minitab sucht. Diese Anzahl von Surrogaten wird jedoch möglicherweise gar nicht gefunden.
Der Standardwert ist 10.
Minimale Anzahl der Fälle zum Teilen eines internen Knotens
Geben Sie die minimale Anzahl von Fällen ein, die ein Knoten aufweisen kann, wenn er immer noch in weitere Knoten geteilt werden kann. Der Standardwert ist 10. Bei größeren Stichprobenumfängen empfiehlt es sich möglicherweise, dieses Minimum zu erhöhen. Wenn ein interner Knoten beispielsweise über 10 oder mehr Fälle verfügt, versucht Minitab, diesen zu teilen. Verfügt der interne Knoten hingegen über höchstens 9 Fälle, versucht Minitab nicht, diesen zu teilen.
Das Limit für interne Knoten muss sich auf mindestens das Doppelte des Limits für Endknoten belaufen, ein größeres Verhältnis ist jedoch besser. Limits für interne Knoten, die sich auf mindestens das Dreifache des Limits für Endknoten belaufen, lassen eine sinnvolle Anzahl von Teilern zu.
Minimal zulässige Anzahl der Fälle für einen Endknoten
Geben Sie die Mindestanzahl von Fällen ein, die in einem Endknoten enthalten sein können. Der Standardwert ist 3. Bei größeren Stichprobenumfängen empfiehlt es sich möglicherweise, dieses Minimum zu erhöhen. Wenn z. B. bei einer Teilung ein Knoten mit weniger als drei Fällen erstellt würde, führt Minitab keine Teilung durch.
Maximale Baumtiefe
Geben Sie einen Wert ein, um die maximale Tiefe eines Baums darzustellen. Der Wurzelknoten entspricht einer Tiefe von 1. Wenn Sie sicher sein möchten, dass Sie den besten Baum erhalten, müssen Sie einen tieferen Baum zulassen, auch wenn dies die Verarbeitung möglicherweise verlangsamt.
Gewichtungen
Geben Sie eine Spalte ein, die die Fallgewichtungen enthält. Die Spalte muss dieselbe Anzahl von Zeilen wie die Spalte der Antwortvariablen aufweisen. Die Werte müssen ≥ 0 sein. Minitab lässt Zeilen aus der Analyse aus, die fehlende Werte oder Nullwerte enthalten.