Diagramm der relativen Variablenwichtigkeit für Random Forests® Regression

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Die Grafik „Relative Variablenwichtigkeit“ zeigt die Prädiktoren in der Reihenfolge ihrer Auswirkungen auf die Modellverbesserung, wenn Teilungen anhand eines Prädiktors über die Abfolge der Bäume hinweg vorgenommen werden. Die Variable mit dem höchsten Verbesserungswert wird als wichtigste Variable festgelegt, die übrigen Variablen folgen in der Reihenfolge ihrer Wichtigkeit. Bei der relativen Variablenwichtigkeit werden die Wichtigkeitswerte standardisiert, sodass sie leichter interpretiert werden können. Die relative Wichtigkeit ist definiert als die prozentuale Verbesserung in Bezug auf den wichtigsten Prädiktor, der eine Wichtigkeit von 100 % aufweist.

Die relative Wichtigkeit wird berechnet, indem die Wichtigkeitswerte aller Variablen durch den größten Wichtigkeitswert der Variablen dividiert werden und das Ergebnis mit 100 % multipliziert wird.

Interpretation

Die relative Variablenwichtigkeit kann Werte von 0 % bis 100 % annehmen. Die wichtigste Variable hat immer eine relative Wichtigkeit von 100 %. Wird eine Variable überhaupt nicht im Modell verwendet, ist sie nicht wichtig.

Die wichtigste Prädiktorvariable für die Prognose des Verkaufspreises ist „Qualität“. Wenn der Beitrag der obersten Prädiktorvariablen, „Qualität“, 100 % beträgt, hat die nächstwichtige Variable, „Wohnflächengröße“, einen Beitrag von 88,8%. Das heißt, das die Größe der Wohnfläche ist 88,8% so wichtig wie die geografische Lage der Immobilie. Die nächstwichtigste Variable ist „Nachbarschaft“ mit einem Beitrag von 52,6%.