Wichtige Prädiktoren

Die Anzahl der Prädiktoren mit positiver relativer Wichtigkeit.

Jeder Regressionsbaum ist eine Auflistung von Teilungen. Jede Teilung trägt zur Verbesserung des Baums bei. Jede Teilung enthält außerdem Surrogat-Teilungen, die ebenfalls eine Verbesserungen des Baums bewirken. Die Wichtigkeit einer Variablen wird durch alle ihre Verbesserungen angegeben, wenn der Baum die Variable zum Teilen eines Knotens oder bei Vorliegen eines fehlenden Werts in einer anderen Variablen als Surrogat zum Teilen eines Knotens verwendet. Mit der folgenden Formel wird die Verbesserung an einem einzelnen Knoten berechnet:

Die Werte von I(t), pLinks und pRechts hängen vom Kriterium zum Teilen der Knoten ab. Weitere Informationen finden Sie unter Knotenteilungsmethoden in CART® Regression.

Die Formel für die relative Wichtigkeit für den q-ten Prädiktor skaliert die Wichtigkeit anhand der wichtigsten Variablen:

R-Quadrat

R2 wird auch als Determinationskoeffizient bezeichnet.

Wurzel des mittleren quadrierten Fehlers (RMSE)

Mittlerer quadrierter Fehler (MSE)

Mittlere absolute Abweichung (MAD)

Mittlerer absoluter prozentualer Fehler (MAPE)

Notation

BegriffBeschreibung
yii-ter beobachteter Wert der Antwortvariablen
Mittelwert der Antwortvariablen
i -ter angepasster Wert der Antwortvariablen
NAnzahl der Einträge