Angeben der Standardeinstellungen für CART® Regression

Datei > Optionen > Prädiktive Analysen > CART® Regression

Geben Sie die Standardmethoden für Regressionsstrukturen an. Die an den Standardeinstellungen vorgenommenen Änderungen bleiben auch nach dem Beenden von Minitab in Kraft, bis Sie sie wieder ändern.

Knotenteilungsmethode
Wählen Sie die Teilungsmethode aus, um den Entscheidungsbaum zu generieren. Sie können die Ergebnisse aus beiden Teilungsmethoden vergleichen, um die beste Option für Ihre Anwendung zu ermitteln.
  • Geringster quadrierter Fehler: Der geringste quadrierte Fehler ist die Standardmethode, die in vielen Anwendungen gut funktioniert. Bei der Verwendung des geringsten quadrierten Fehlers wird die Summe der quadrierten Fehler minimiert.
  • Geringste absolute Abweichung: Bei der Verwendung der geringsten absoluten Abweichung wird die Summe der Absolutwerte der Fehler minimiert.
Kriterium für Auswahl des optimalen Baums
Wenn Geringster quadrierter Fehler das Kriterium für die Knotenteilungsmethode ist, treffen Sie eine Auswahl unter diesen Kriterien, um den Baum in den Ergebnissen zu generieren. Sie können die Ergebnisse aus verschiedenen Bäumen vergleichen, um die beste Option für Ihre Anwendung zu ermitteln.
Maximales R-Quadrat
Wählen Sie diese Option aus, um Ergebnisse für den Baum mit dem maximalen R-Quadrat anzuzeigen.
Innerhalb von K Standardfehlern des maximalen R-Quadrat; K=
Wählen Sie diese Option aus, damit Minitab den kleinsten Baum mit einem R2 auswählt, das innerhalb von K Standardfehlern des Baums mit dem maximalen R2 fällt. In der Standardeinstellung ist K=1, sodass der Baum in den Ergebnissen der kleinste Klassifikationsbaum mit einem R2 innerhalb von 1 Standardfehler des maximalen R2 ist.
Wenn Geringste absolute Abweichung als Knotenteilungsmethode ausgewählt ist, treffen Sie eine Auswahl unter diesen Kriterien, um den Baum in den Ergebnissen auszuwählen. Sie können die Ergebnisse aus verschiedenen Bäumen vergleichen, um die beste Option für Ihre Anwendung zu ermitteln.
Geringste mittlere absolute Abweichung
Wählen Sie diese Option aus, um die Ergebnisse für den Baum mit der geringsten mittleren absoluten Abweichung anzuzeigen.
Innerhalb von K Standardfehlern der geringsten mittleren absoluten Abweichung; K=
Wählen Sie diese Option aus, damit Minitab einen Baum mit einer mittleren absoluten Abweichung auswählt, die innerhalb von K Standardfehlern des Baums mit der geringsten mittleren absoluten Abweichung liegt. In der Standardeinstellung ist K=1, sodass der Baum in den Ergebnissen der kleinste Klassifikationsbaum mit einer mittleren absoluten Abweichung innerhalb von 1 Standardfehler der geringsten absoluten Abweichung ist.
Minimale Anzahl der Fälle zum Teilen eines internen Knotens
Geben Sie einen Wert ein, der die minimale Anzahl von Fällen darstellt, bei denen ein interner Knoten geteilt wird. Der Standardwert ist 10. Bei größeren Stichprobenumfängen empfiehlt es sich möglicherweise, dieses Minimum zu erhöhen. Wenn ein interner Knoten beispielsweise über 10 oder mehr Fälle verfügt, wird Minitab versuchen, diesen zu teilen. Verfügt der interne Knoten hingegen über höchstens 9 Fälle, wird Minitab nicht versuchen, diesen zu teilen.
Das Limit für interne Knoten muss sich auf mindestens das Doppelte des Limits für Endknoten belaufen, ein größeres Verhältnis ist jedoch besser. Limits für interne Knoten, die sich auf mindestens das Dreifache des Limits für Endknoten belaufen, lassen eine sinnvolle Anzahl von Teilern zu.
Der Standardwert ist 10.
Minimal zulässige Anzahl der Fälle für einen Endknoten
Geben Sie einen Wert ein, der die minimale Anzahl von Fällen darstellt, die in einen Endknoten abgeteilt werden können. Der Standardwert ist 3. Bei größeren Stichprobenumfängen empfiehlt es sich möglicherweise, dieses Minimum zu erhöhen. Wenn z. B. bei einer Teilung ein Knoten mit weniger als 3 Fällen erstellt würde, wird Minitab keine Teilung durchführen.
Der Standardwert ist 3.
Strafe für fehlenden Wert
Geben Sie einen Strafwert für einen Prädiktor mit fehlenden Werten ein. Da es einfacher ist, mit weniger Daten ein guter Teiler zu sein, haben Prädiktoren mit fehlenden Daten einen Vorteil gegenüber Prädiktoren ohne fehlende Daten. Verwenden Sie diese Option, um Prädiktoren mit fehlenden Daten zu bestrafen.
0,0 ≤ K ≤ 2,0, z. B.:
  • K = 0: Gibt keine Strafe an.
  • K = 2: Gibt die höchste Strafe an.
Strafe für Kategorie auf hoher Stufe
Geben Sie einen Strafwert für kategoriale Prädiktoren mit vielen Werten ein. Da kategoriale Prädiktoren mit vielen Stufen einen Baum aufgrund ihrer erhöhten Aufspaltungsleistung verzerren können, haben sie einen Vorteil gegenüber Prädiktoren mit weniger Stufen. Verwenden Sie diese Option, um Prädiktoren mit vielen Stufen bestrafen.
0,0 ≤ K ≤ 5,0, z. B.:
  • K = 0: Gibt keine Strafe an.
  • K = 5: Gibt die höchste Strafe an.
Anzeige von Grafiken und Tabellen
Residuen für Diagramme
Geben Sie den Typ der Residuen an, die im Boxplot der Residuen angezeigt werden sollen.
  • Regulär: In der Standardeinstellung werden im Boxplot reguläre Residuen angezeigt.
  • Prozent: Hiermit geben Sie an, dass die prozentualen Residuen im Boxplot angezeigt werden sollen.
Endknotentyp
Wählen Sie aus, ob die besten Knoten und/oder die schlechtesten Knoten für die Tabelle der Anpassungen und Fehlerstatistiken und die Tabelle der Kriterien für die Klassifikation der Prüfobjekte angezeigt werden sollen.
  • Bester: In der Standardeinstellung zeigt Minitab die besten Endknoten an. Die besten Knoten weisen den niedrigsten MSE oder die niedrigste MAD auf.
  • Schlechtester: Wählen Sie diese Option aus, um die schlechtesten Endknoten anzuzeigen. Die schlechtesten Knoten weisen den höchsten MSE oder die höchste MAD auf.
  • Bester und schlechtester: Wählen Sie diese Option aus, um die besten und schlechtesten Endknoten anzuzeigen.