Eingeben der Daten für Random Forests®-Klassifikation

Predictive Analytics-Modul > Random Forests®-Klassifikation
Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Wählen Sie die Option aus, die Ihre Daten am besten beschreibt.

Binäre Antwort

Führen Sie die folgenden Schritte aus, wenn die Daten der kategorialen Antwortvariablen zwei Kategorien aufweisen, z. B. „Bestanden“ und „Nicht bestanden“.

  1. Wählen Sie in der Dropdown-Liste die Option Binäre Antwort aus.
  2. Geben Sie im Feld Antwort die Spalte ein, die die Werte der binären Antwortvariablen enthält. Werte können numerisch oder Text sein.
  3. Wählen Sie im Feld Antwortereignis aus, welches Ereignis die Analyse beschreiben soll. In der Standardeinstellung wird die zweite Stufe der Antwortvariablen als Ereignis der Antwortvariablen ausgewählt. Das Ändern des Ereignisses der Antwortvariablen wirkt sich nicht auf das Modell aus, kann aber die Ergebnisse aussagekräftiger machen.
  4. Geben Sie im Feld Stetige Prädiktoren die stetigen Variablen ein, die Änderungen in der Antwortvariablen erklären oder prognostizieren können. Die stetigen Prädiktoren müssen numerische Werte sein.
  5. Geben Sie im Feld Kategoriale Prädiktoren die kategorialen Variablen ein, die Änderungen in der Antwortvariablen erklären oder prognostizieren können. Die kategorialen Prädiktoren können Textwerte oder numerische Werte sein.
In diesem Arbeitsblatt ist Gekauft die binäre Antwortvariable; diese Spalte gibt an, ob ein Verbraucher eine neue Frühstücksflockenmarke gekauft hat. Das Ereignis der Antwortvariablen lautet Ja. Einkommen und Kinder sind stetige Prädiktoren. Geschäft und SpotGesehen sind kategoriale Prädiktoren.

Aus der ersten Zeile des Arbeitsblatts geht hervor, dass der Verbraucher die neue Marke von Frühstücksflocken gekauft hat. Dieser Verbraucher hat ein Einkommen von 37.000 Dollar, kauft in Geschäft A ein, hat ein Kind und sah die Werbung für die Frühstücksflocken.

C1-T C2 C3-T C4 C5-T
Gekauft Einkommen Geschäft Kinder SpotGesehen
Ja 37.000$ A 1 Ja
Nein 47.000$ A 3 Nein
Ja 34.000$ A 0 Nein
Ja 58.000 $ B 0 Nein

Multinomiale Antwort

Führen Sie die folgenden Schritte aus, wenn die kategoriale Antwortvariable drei oder mehr Kategorien enthält, z. B. Limousine, LKW und SUV.

  1. Wählen Sie in der Dropdown-Liste die Option Multinomiale Antwort aus.
  2. Geben Sie im Feld Antwort die Spalte ein, die die Daten der kategorialen Antwortvariablen enthält. Werte können numerisch oder Text sein.
  3. Geben Sie im Feld Stetige Prädiktoren die stetigen Variablen ein, die Änderungen in der Antwortvariablen erklären oder prognostizieren können. Die stetigen Prädiktoren müssen numerische Werte sein.
  4. Geben Sie im Feld Kategoriale Prädiktoren die kategorialen Variablen ein, die Änderungen in der Antwortvariablen erklären oder prognostizieren können. Die kategorialen Prädiktoren können Textwerte oder numerische Werte sein.
In diesem Arbeitsblatt ist Soll die multinomiale Antwortvariable; diese Spalte gibt an, ob ein Kreditantragsteller ein geringes, mittleres oder hohes Risiko darstellt. Einkommen und AnzahlKarten sind stetige Prädiktoren. FamStd ist ein kategorialer Prädiktor.

Die erste Zeile im Arbeitsblatt zeigt, dass ein Bewerber mit geringem Risiko ein Einkommen von 2399 hat, drei Kreditkarten hat und ledig ist.

C1-T C2 C3 C4-T
Soll Einkommen AnzahlKarten FamStd
Niedrig 2399 3 Ledig
Mittel 2915 5 Ledig
Mittel 3100 0 Verheiratet
Hoch 1500 8 Verheiratet