Übersicht über Random Forests®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Verwenden Sie Random Forests®-Klassifikation, um ein hochleistungsfähiges Prognosemodell für eine kategoriale Antwortvariable mit vielen stetigen und kategorialen Prädiktorvariablen zu erstellen. Random Forests®-Klassifikation kombiniert Informationen aus vielen CART®-Bäumen und bietet damit einen erheblichen Fortschritt beim Data Mining.

Random Forests®-Klassifikation bietet Einblicke für eine breite Palette von Anwendungen, einschließlich Qualitätskontrolle in der Fertigung, Wirkstofferkennung, Betrugserkennung, Bonitätsbewertung und Abwanderungsprognose. Verwenden Sie die Ergebnisse, um wichtige Variablen zu identifizieren, Gruppen in den Daten mit wünschenswerten Merkmalen zu ermitteln und Werte der Antwortvariablen für neue Beobachtungen zu prognostizieren. Ein Marktforscher kann Random Forests®-Klassifikation beispielsweise verwenden, um Kunden mit höheren Rücklaufquoten für bestimmte Initiativen zu identifizieren und diese Rücklaufquoten zu prognostizieren.

CART® Klassifikation ist ein gutes Werkzeug zur anfänglichen Untersuchung von Daten und bietet ein leicht verständliches Modell, um rasch wichtige Prädiktoren zu identifizieren. Ziehen Sie nach der ersten Untersuchung mit CART® Klassifikation die Optionen TreeNet®-Klassifikation oder Random Forests®-Klassifikation als notwendigen Folgeschritt in Erwägung.

Die Ausgabe von Random Forests®-Klassifikation enthält Diagramme der relativen Variablenwichtigkeit, ROC-Kurven sowie Lift- und Gain-Diagramme. Anhand dieser Diagramme können Sie leichter auswerten, ob die Variablen im Modell die Klassen der Antwortvariablen mit hoher Genauigkeit prognostizieren, und Sie können die wichtigsten Prädiktoren für die Prognosegenauigkeit bestimmen. Diese Informationen sind nützlich, wenn Sie die Einstellungen steuern möchten, die ein optimales Produktionsergebnis liefern.

Die Methode wurde von Leo Breiman und Adele Cutler von der University of California, Berkeley entwickelt.

Wo finde ich diese Analyse?

Um Random Forests®-Klassifikation auszuführen, wählen Sie Predictive Analytics-Modul > Random Forests®-Klassifikation aus.

In welchen Fällen bietet sich eine andere Analyse an?

Wenn Sie ein parametrisches Regressionsmodell mit einer kategorialen Antwortvariablen ausprobieren möchten, verwenden Sie Binäres logistisches Modell anpassen.