Übersicht über Anpassen des Modells und Ermitteln von wichtigen Prädiktoren für TreeNet®-Klassifikation

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Verwenden Sie TreeNet®-Klassifikation, um Klassifikationsbäume mit Gradient Boosting für eine kategoriale Antwortvariable mit vielen stetigen und kategorialen Prädiktorvariablen zu erzeugen. TreeNet®-Klassifikation stellt einen bahnbrechenden Fortschritt in der Data-Mining-Technologie dar und wurde von Jerome Friedman entwickelt, einem der weltweit führenden Forscher auf dem Gebiet des Data Mining. Dieses flexible und leistungsstarke Data-Mining-Werkzeug ist in der Lage, einheitlich, in überragender Geschwindigkeit und mit hoher Toleranz für ungeordnete und unvollständige Daten äußerst exakte Modelle zu erstellen.

Ein Marktforscher kann TreeNet®-Klassifikation beispielsweise verwenden, um Kunden mit höheren Rücklaufquoten für bestimmte Initiativen zu identifizieren und diese Rücklaufquoten zu prognostizieren.

CART® Klassifikation ist ein gutes Werkzeug zur anfänglichen Untersuchung von Daten und bietet ein leicht verständliches Modell, um rasch wichtige Prädiktoren zu identifizieren. Ziehen Sie nach der ersten Untersuchung mit CART® Klassifikation die Option TreeNet®-Klassifikation als notwendigen Folgeschritt in Erwägung. TreeNet®-Klassifikation liefert ein leistungsstarkes und komplexeres Modell, das mehrere hundert kleine Bäume umfassen kann. Jeder Baum leistet einen kleinen Beitrag zum Gesamtmodell. Basierend auf den Ergebnissen von TreeNet®-Klassifikation können Einblicke in die Beziehung zwischen einer kategorialen Antwortvariablen und den wichtigen Prädiktoren aus vielen Kandidatenprädiktoren gewonnen und die Klassenwahrscheinlichkeiten der Antwortvariablen für neue Beobachtungen mit großer Genauigkeit prognostiziert werden.

Die Analyse mit TreeNet®-Klassifikation liefert Diagramme der partiellen Abhängigkeit bei einem und zwei Prädiktoren. Anhand dieser Diagramme können Sie auswerten, wie sich Änderungen von wichtigen Prognosevariablen auf die Werte der Antwortvariablen auswirken. Daher können diese Informationen nützlich sein, um die Einstellungen zu steuern, die ein optimales Produktionsergebnis ermöglichen.

Die TreeNet®-Klassifikation-Analyse bietet auch die Möglichkeit, verschiedene Hyperparameter für ein Modell auszuprobieren. Die Trainingsrate und die Teilstichproben-Fraktion sind Beispiele für Hyperparameter. Die Untersuchung verschiedener Werte ist eine gängige Methode zur Verbesserung der Modellleistung.

Eine umfassendere Einführung in die CART®-Methodik finden Sie in Breiman, Friedman, Olshen und Stone (1984)1 and 2.

Anpassen des Modells

Verwenden Sie Anpassen des Modells, um einfache Klassifikationsbäume mit Gradient Boosting für eine kategoriale Antwortvariable mit vielen stetigen und kategorialen Prädiktorvariablen aufzubauen. Die Ergebnisse beziehen sich auf das Modell aus dem Trainingsprozess mit der maximalen Log-Likelihood, der maximalen Fläche unter der ROC-Kurve oder der minimalen Fehlklassifizierungsrate.

Ermitteln von wichtigen Prädiktoren

Für einen Datensatz mit vielen Prädiktoren, bei dem einige Prädiktoren weniger Einfluss auf die Antwortvariablen haben als andere, sollten Sie die Verwendung von Ermitteln von wichtigen Prädiktoren in Betracht ziehen, um unwichtige Prädiktoren aus dem Modell zu entfernen. Das Entfernen der unwichtigen Prädiktoren hilft, die Effekte der wichtigsten Prädiktoren zu klären und verbessert die Prognosegenauigkeit. Der Algorithmus entfernt nacheinander die am wenigsten wichtigen Prädiktoren, zeigt Ihnen Ergebnisse an, mit denen Sie Modelle mit unterschiedlicher Anzahl von Prädiktoren vergleichen können, und erzeugt Ergebnisse für den Satz von Prädiktoren mit dem besten Wert des Genauigkeitskriteriums.

Ein Marktforscher verwendet Ermitteln von wichtigen Prädiktoren beispielsweise, um automatisch etwa ein Dutzend Prädiktoren aus einer Gruppe von 500 Prädiktoren zu identifizieren, die effektiv modellieren, welche Kunden höhere Antwortraten auf bestimmte Initiativen haben.

Ermitteln von wichtigen Prädiktoren kann auch die wichtigsten Prädiktoren entfernen, um den Effekt jedes wichtigen Prädiktors auf die Prognosegenauigkeit eines Modells quantitativ zu bewerten.

Wo finde ich diese Analyse?

Um Anpassen des Modells auszuführen, wählen Sie Predictive Analytics-Modul > TreeNet® Klassifikation > Modell anpassen aus.

Um Ermitteln von wichtigen Prädiktoren auszuführen, wählen Sie Predictive Analytics-Modul > TreeNet® Klassifikation > Wichtige Prädiktoren ermitteln aus.

In welchen Fällen bietet sich eine andere Analyse an?

Wenn Sie ein parametrisches Regressionsmodell mit einer binären Antwortvariablen ausprobieren möchten, verwenden Sie Binäres logistisches Modell anpassen.

Um die Leistung eines Random Forests®-Klassifikationsmodells zu vergleichen, verwenden Sie Random Forests®-Klassifikation

1 Breiman, Friedman, Olshen und Stone. (1984). Classification and Regression Trees. Boca Raton, Florida: Chapman & Hall/CRC.
2 H. Zhang and B.H. Singer. (2010). Recursive Partitioning and Applications. New York, New York: Springer