Überlegungen zu Daten für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet®-Klassifikation

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Um die Gültigkeit Ihrer Ergebnisse sicherzustellen, befolgen Sie beim Erfassen von Daten, beim Durchführen der Analyse und beim Interpretieren der Ergebnisse die folgenden Richtlinien.

Die Antwortvariable sollte kategorial sein
Kategoriale Variablen umfassen eine endliche, zählbare Anzahl von Kategorien oder eindeutigen Gruppen. Kategoriale Daten können eine logische Reihenfolge haben, dies ist jedoch nicht erforderlich. Zu den kategorialen Variablen zählen beispielsweise Geschlecht, Materialtyp und Zahlungsmethode.
  • Wenn Ihre Antwortvariable zwei Kategorien aufweist, z. B. „Bestanden“ und „Nicht bestanden“, ist die Antwortvariable binär.
  • Wenn Ihre Antwortvariable drei oder mehr Kategorien enthält, ist die Antwortvariable multinomial.

Die Daten für die Antwortvariable müssen entweder Textwerte oder numerische Werte sein. Datum-/Uhrzeitwerte sind nicht zulässig.

Wenn Ihre Antwortvariable stetig ist, verwenden Sie Anpassen des Modells oder Ermitteln von wichtigen Prädiktoren für TreeNet® Regression .

Prädiktorvariablen können stetig oder kategorial sein
Sie können eine Kombination aus stetigen oder kategorialen Prädiktoren verwenden. Die Länge der Spalten für jeden Prädiktor muss jedoch der Länge der Spalte der Antwortvariablen entsprechen. Fehlende Werte sind zulässig.
  • Alle stetigen Prädiktoren müssen numerisch sein.
  • Kategoriale Prädiktoren können Textwerte oder numerische Werte sein.
Bei mehr als 2000 Fällen wird ein Testdatensatz empfohlen

Standardmäßig verwendet Minitab die Kreuzvalidierung, wenn die Anzahl der Fälle ≤ 2000 ist. Liegen mehr als 2000 Fälle vor, verwendet Minitab einen Testdatensatz. Normalerweise ist die Kreuzvalidierung eine bessere Validierungsmethode, erfordert jedoch mehr Zeit für die Berechnung der Ergebnisse. Die Validierung mit einem Testdatensatz ist nützlich, wenn die Kreuzvalidierungsmethode zu zeitaufwändig ist.

Weitere Informationen zu den Einstellungen für Validierungsmethoden in Anpassen des Modells und Ermitteln von wichtigen Prädiktoren finden Sie unter Angeben der Validierungsmethode für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet®-Klassifikation.