Wichtige Prädiktoren

Die Anzahl der Prädiktoren mit positiver relativer Wichtigkeit.

Jeder Regressionsbaum ist eine Auflistung von Teilungen. Jede Teilung trägt zur Verbesserung des Baums bei. Jede Teilung enthält außerdem Surrogat-Teilungen, die ebenfalls eine Verbesserungen des Baums bewirken. Die Wichtigkeit einer Variablen wird durch alle ihre Verbesserungen angegeben, wenn der Baum die Variable zum Teilen eines Knotens oder bei Vorliegen eines fehlenden Werts in einer anderen Variablen als Surrogat zum Teilen eines Knotens verwendet. Mit der folgenden Formel wird die Verbesserung an einem einzelnen Knoten berechnet:

Die Werte von I(t), pLinks und pRechts hängen vom Kriterium für die Teilung der Knoten ab. Weitere Informationen finden Sie unter Knotenteilungsmethoden in CART® Regression.

Die Formel für die relative Wichtigkeit für den q-ten Prädiktor skaliert die Wichtigkeit anhand der wichtigsten Variablen:

R-Quadrat

R2 wird auch als Determinationskoeffizient bezeichnet.

Wurzel des mittleren quadrierten Fehlers (RMSE)

Mittlerer quadrierter Fehler (MSE)

Mittlere absolute Abweichung (MAD)

Mittlerer absoluter prozentualer Fehler (MAPE)

Notation

BegriffBeschreibung
yi i -ter observed response value
mean response
i -ter fitted response
Nnumber of records
Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien