Überlegungen zu Daten für Random Forests®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Um die Gültigkeit Ihrer Ergebnisse sicherzustellen, befolgen Sie beim Erfassen von Daten, beim Durchführen der Analyse und beim Interpretieren der Ergebnisse die folgenden Richtlinien.

Die Antwortvariable sollte kategorial sein
Kategoriale Variablen umfassen eine endliche, zählbare Anzahl von Kategorien oder eindeutigen Gruppen. Kategoriale Daten können eine logische Reihenfolge haben, dies ist jedoch nicht erforderlich. Zu den kategorialen Variablen zählen beispielsweise Geschlecht, Materialtyp und Zahlungsmethode.
  • Wenn Ihre Antwortvariable zwei Kategorien aufweist, z. B. „Bestanden“ und „Nicht bestanden“, ist die Antwortvariable binär.
  • Wenn Ihre Antwortvariable drei oder mehr Kategorien enthält, ist die Antwortvariable multinomial.

Die Daten für die Antwortvariable müssen entweder Textwerte oder numerische Werte sein. Datum-/Uhrzeitwerte sind nicht zulässig.

Wenn Ihre Antwortvariable stetig ist, verwenden Sie Random Forests® Regression.

Prädiktorvariablen können stetig oder kategorial sein
Sie können eine Kombination aus stetigen oder kategorialen Prädiktoren verwenden. Die Länge der Spalten für jeden Prädiktor muss jedoch der Länge der Spalte der Antwortvariablen entsprechen. Fehlende Werte sind zulässig.
  • Alle stetigen Prädiktoren müssen numerisch sein.
  • Kategoriale Prädiktoren können Textwerte oder numerische Werte sein.