Übersicht über Anpassen des Modells und Ermitteln von wichtigen Prädiktoren für TreeNet® Regression

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Verwenden Sie TreeNet® Regression, um Regressionsbäume mit Gradient Boosting für eine stetige Antwortvariable mit vielen stetigen und kategorialen Prädiktorvariablen zu erzeugen. TreeNet® Regression stellt einen bahnbrechenden Fortschritt in der Data-Mining-Technologie dar und wurde von Jerome Friedman entwickelt, einem der weltweit führenden Forscher auf dem Gebiet des Data Mining. Dieses flexible und leistungsstarke Data-Mining-Werkzeug ist in der Lage, einheitlich, in überragender Geschwindigkeit und mit hoher Toleranz für ungeordnete und unvollständige Daten äußerst exakte Modelle zu erstellen.

Ein Forscher in der Medizin kann TreeNet® Regression beispielsweise verwenden, um Patienten mit höheren Ansprechraten auf bestimmte Behandlungen zu identifizieren und diese Ansprechraten zu prognostizieren.

CART® Regression ist ein gutes Werkzeug zur anfänglichen Untersuchung von Daten und bietet ein leicht verständliches Modell, um rasch wichtige Prädiktoren zu identifizieren. Ziehen Sie nach der ersten Untersuchung mit CART® Regression die Option TreeNet® Regression als notwendigen Folgeschritt in Erwägung. TreeNet® Regression liefert ein leistungsstarkes und komplexeres Modell, das mehrere hundert kleine Bäume umfassen kann. Jeder Baum leistet einen kleinen Beitrag zum Gesamtmodell. Basierend auf den Ergebnissen von TreeNet® Regression können Einblicke in die Beziehung zwischen einer stetigen Antwortvariablen und den wichtigen Prädiktoren aus vielen Kandidatenprädiktoren gewonnen und Antwortvariablen für neue Beobachtungen mit großer Genauigkeit prognostiziert werden.

Die Analyse mit TreeNet® Regression liefert Diagramme der partiellen Abhängigkeit bei einem und zwei Prädiktoren. Anhand dieser Diagramme können Sie auswerten, wie sich Änderungen von wichtigen Prognosevariablen auf die Werte der Antwortvariablen auswirken. Daher können diese Informationen nützlich sein, um die Einstellungen zu steuern, die ein optimales Produktionsergebnis ermöglichen.

Die TreeNet® Regression-Analyse bietet auch die Möglichkeit, verschiedene Hyperparameter für ein Modell auszuprobieren. Die Trainingsrate und die Teilstichproben-Fraktion sind Beispiele für Hyperparameter. Die Untersuchung verschiedener Werte ist eine gängige Methode zur Verbesserung der Modellleistung.

Eine umfassendere Einführung in die CART®-Methodik finden Sie in Breiman, Friedman, Olshen und Stone (1984)1 and 2.

Anpassen des Modells

Verwenden Sie Anpassen des Modells, um einfache Regressionsbäume mit Gradient Boosting für eine stetige Antwortvariable mit vielen stetigen und kategorialen Prädiktorvariablen aufzubauen. Die Ergebnisse sind für das Modell aus dem Trainingsprozess mit dem maximalen R2-Wert oder der minimalen absoluten Abweichung.

Ermitteln von wichtigen Prädiktoren

Für einen Datensatz mit vielen Prädiktoren, bei dem einige Prädiktoren weniger Einfluss auf die Antwortvariablen haben als andere, sollten Sie die Verwendung von Ermitteln von wichtigen Prädiktoren in Betracht ziehen, um unwichtige Prädiktoren aus dem Modell zu entfernen. Das Entfernen der unwichtigen Prädiktoren hilft, die Effekte der wichtigsten Prädiktoren zu klären und verbessert die Prognosegenauigkeit. Der Algorithmus entfernt nacheinander die am wenigsten wichtigen Prädiktoren, zeigt Ihnen Ergebnisse an, mit denen Sie Modelle mit unterschiedlicher Anzahl von Prädiktoren vergleichen können, und erzeugt Ergebnisse für den Satz von Prädiktoren mit dem besten Wert des Genauigkeitskriteriums.

Ein Chemiker verwendet Ermitteln von wichtigen Prädiktoren beispielsweise, um automatisch etwa ein Dutzend Prädiktoren aus einer Gruppe von 500 Prädiktoren zu identifizieren, die die Viskosität in einer neuen Kraftstoffmischung effektiv modellieren.

Ermitteln von wichtigen Prädiktoren kann auch die wichtigsten Prädiktoren entfernen, um den Effekt jedes wichtigen Prädiktors auf die Prognosegenauigkeit eines Modells quantitativ zu bewerten.

Wo finde ich diese Analyse?

Um Anpassen des Modells auszuführen, wählen Sie Predictive Analytics-Modul > TreeNet® Regression > Modell anpassen aus.

Um Ermitteln von wichtigen Prädiktoren auszuführen, wählen Sie Predictive Analytics-Modul > TreeNet® Regression > Wichtige Prädiktoren ermitteln aus.

In welchen Fällen bietet sich eine andere Analyse an?

Wenn Sie ein parametrisches Regressionsmodell mit einer stetigen Antwortvariablen ausprobieren möchten, verwenden Sie Regressionsmodell anpassen.

Um die Leistung eines Random Forests® Regressionsmodells zu vergleichen, verwenden Sie Random Forests® Regression.

1 Breiman, Friedman, Olshen und Stone. (1984). Classification and Regression Trees. Boca Raton, Florida: Chapman & Hall/CRC.
2 H. Zhang and B.H. Singer. (2010). Recursive Partitioning and Applications. New York, New York: Springer