Überlegungen zu Daten für CART® Regression

Um die Gültigkeit Ihrer Ergebnisse sicherzustellen, befolgen Sie beim Erfassen von Daten, beim Durchführen der Analyse und beim Interpretieren der Ergebnisse die folgenden Richtlinien.

Die Antwortvariable (Ziel) muss stetig sein
Eine stetige Variable kann gemessen und geordnet werden, und sie kann zwischen zwei beliebigen Werten eine unendliche Anzahl von Werten annehmen. Die Durchmesser einer Stichprobe von Reifen sind beispielsweise eine stetige Variable.

Die Daten für die Antwortvariable müssen numerische Werte sein.

Wenn Ihre Antwortvariable kategorial ist, verwenden Sie CART® Klassifikation.

Prädiktorvariablen können stetig oder kategorial sein
Sie können eine Kombination aus stetigen oder kategorialen Prädiktoren verwenden. Die Länge der Spalten für jeden Prädiktor muss jedoch der Länge der Spalte der Antwortvariablen entsprechen. Fehlende Werte sind zulässig.
  • Alle stetigen Prädiktoren müssen numerisch sein.
  • Kategoriale Prädiktoren können Textwerte oder numerische Werte sein.
Bei mehr als 5000 Fällen wird ein Testdatensatz empfohlen

Standardmäßig verwendet Minitab die Kreuzvalidierung, wenn sich die Anzahl der Fälle auf höchstens 5000 beläuft. Liegen mehr als 5000 Fälle vor, verwendet Minitab einen Testdatensatz. Die Validierung mit einem Trainingsdatensatz und einem Testdatensatz ist hilfreich bei einem großen Datensatz. Weitere Informationen zu den Einstellungen für Validierungsverfahren in CART® Regression finden Sie unter Angeben der Validierungsmethode für CART® Regression.