Auswählen der Analyseoptionen für CART® Regression

Predictive Analytics-Modul > CART® Regression > Optionen

Wählen Sie die Analyseoptionen aus.

Knotenteilungsmethode
Wählen Sie die Teilungsmethode aus, um den Entscheidungsbaum zu generieren. Sie können die Ergebnisse aus beiden Teilungsmethoden vergleichen, um die beste Option für Ihre Anwendung zu ermitteln.
  • Geringster quadrierter Fehler: Der geringste quadrierte Fehler ist die Standardmethode, die in vielen Anwendungen gut funktioniert. Bei der Verwendung des geringsten quadrierten Fehlers wird die Summe der quadrierten Fehler minimiert.
  • Geringste absolute Abweichung: Bei der Verwendung der geringsten absoluten Abweichung wird die Summe der Absolutwerte der Fehler minimiert.
Kriterium für Auswahl des optimalen Baums
Wenn Geringster quadrierter Fehler das Kriterium für die Knotenteilungsmethode ist, treffen Sie eine Auswahl unter diesen Kriterien, um den Baum in den Ergebnissen zu generieren. Sie können die Ergebnisse aus verschiedenen Bäumen vergleichen, um die beste Option für Ihre Anwendung zu ermitteln.
Maximales R-Quadrat
Wählen Sie diese Option aus, um Ergebnisse für den Baum mit dem maximalen R-Quadrat anzuzeigen.
Innerhalb von K Standardfehlern des maximalen R-Quadrat; K=
Wählen Sie diese Option aus, damit Minitab den kleinsten Baum mit einem R2 auswählt, das innerhalb von K Standardfehlern des Baums mit dem maximalen R2 fällt. In der Standardeinstellung ist K=1, sodass der Baum in den Ergebnissen der kleinste Klassifikationsbaum mit einem R2 innerhalb von 1 Standardfehler des maximalen R2 ist.
Wenn Geringste absolute Abweichung als Knotenteilungsmethode ausgewählt ist, treffen Sie eine Auswahl unter diesen Kriterien, um den Baum in den Ergebnissen auszuwählen. Sie können die Ergebnisse aus verschiedenen Bäumen vergleichen, um die beste Option für Ihre Anwendung zu ermitteln.
Geringste mittlere absolute Abweichung
Wählen Sie diese Option aus, um die Ergebnisse für den Baum mit der geringsten mittleren absoluten Abweichung anzuzeigen.
Innerhalb von K Standardfehlern der geringsten mittleren absoluten Abweichung; K=
Wählen Sie diese Option aus, damit Minitab einen Baum mit einer mittleren absoluten Abweichung auswählt, die innerhalb von K Standardfehlern des Baums mit der geringsten mittleren absoluten Abweichung liegt. In der Standardeinstellung ist K=1, sodass der Baum in den Ergebnissen der kleinste Klassifikationsbaum mit einer mittleren absoluten Abweichung innerhalb von 1 Standardfehler der geringsten absoluten Abweichung ist.
Anzahl der Surrogate für einen Prädiktor mit fehlenden Werten
Geben Sie die Anzahl der Surrogate ein, nach denen Minitab sucht, wenn ein Prädiktor fehlende Werte aufweist. Wenn viele Prädiktoren ähnliche Muster fehlender Werte aufweisen, empfiehlt es sich, die Anzahl der Surrogate zu erhöhen.
Diese Zahl stellt die maximale Anzahl von Surrogaten dar, nach denen gesucht wird. Diese Anzahl von Surrogaten wird jedoch möglicherweise gar nicht gefunden.
Der Standardwert ist 10.
Minimale Anzahl der Fälle zum Teilen eines internen Knotens
Geben Sie einen Wert ein, der die minimale Anzahl von Fällen darstellt, bei denen ein interner Knoten geteilt wird. Der Standardwert ist 10. Bei größeren Stichprobenumfängen empfiehlt es sich möglicherweise, dieses Minimum zu erhöhen. Wenn ein interner Knoten beispielsweise über 10 oder mehr Fälle verfügt, versucht Minitab, diesen zu teilen. Verfügt der interne Knoten hingegen über höchstens 9 Fälle, versucht Minitab nicht, diesen zu teilen.
Das Limit für interne Knoten muss sich auf mindestens das Doppelte des Limits für Endknoten belaufen, ein größeres Verhältnis ist jedoch besser. Limits für interne Knoten, die sich auf mindestens das Dreifache des Limits für Endknoten belaufen, lassen eine sinnvolle Anzahl von Teilern zu.
Minimal zulässige Anzahl der Fälle für einen Endknoten
Geben Sie einen Wert ein, der die minimale Anzahl von Fällen darstellt, die in einen Endknoten abgeteilt werden können. Der Standardwert ist 3. Bei größeren Stichprobenumfängen empfiehlt es sich möglicherweise, dieses Minimum zu erhöhen. Wenn z. B. bei einer Teilung ein Knoten mit weniger als drei Fällen erstellt würde, führt Minitab keine Teilung durch.
Maximale Baumtiefe
Geben Sie einen Wert ein, um die maximale Tiefe eines Baums darzustellen. Der Wurzelknoten entspricht einer Tiefe von 1. Wenn Sie sicher sein möchten, dass Sie den besten Baum erhalten, müssen Sie einen tieferen Baum zulassen, auch wenn dies die Verarbeitung möglicherweise verlangsamt.
Gewichtungen
Geben Sie eine Spalte ein, die die Fallgewichtungen enthält. Die Spalte muss dieselbe Anzahl von Zeilen wie die Spalte der Antwortvariablen aufweisen. Die Werte müssen ≥ 0 sein. Minitab lässt Zeilen aus der Analyse aus, die fehlende Werte oder Nullwerte enthalten.