Diagramm der relativen Variablenwichtigkeit für Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Das Diagramm „Relative Variablenwichtigkeit“ zeigt die Prädiktoren in der Reihenfolge ihrer Auswirkungen auf die Modellverbesserung, wenn Teilungen anhand eines Prädiktors über die Abfolge der Bäume hinweg vorgenommen werden. Die Variable mit dem höchsten Verbesserungswert wird als wichtigste Variable festgelegt, die übrigen Variablen folgen in der Reihenfolge ihrer Wichtigkeit. Bei der relativen Variablenwichtigkeit werden die Wichtigkeitswerte standardisiert, sodass sie leichter interpretiert werden können. Die relative Wichtigkeit ist definiert als die prozentuale Verbesserung in Bezug auf den wichtigsten Prädiktor, der eine Wichtigkeit von 100 % aufweist.

Die relative Wichtigkeit wird berechnet, indem die Wichtigkeitswerte aller Variablen durch den größten Wichtigkeitswert der Variablen dividiert werden und das Ergebnis mit 100 % multipliziert wird.

Interpretation

Die relative Variablenwichtigkeit kann Werte von 0 % bis 100 % annehmen. Die wichtigste Variable hat immer eine relative Wichtigkeit von 100 %. Wird eine Variable überhaupt nicht im Modell verwendet, ist sie nicht wichtig.

Die wichtigste Prädiktorvariable ist „Statistisches Kerngebiet“. Wenn die Wichtigkeit der obersten Prädiktorvariablen, „Statistisches Kerngebiet“, 100 % beträgt, hat die nächstwichtigste Variable, „Jahreseinkommen“, einen Beitrag von 57,0 %. Das heißt, das Jahreseinkommen des Kreditnehmers ist 57 % so wichtig wie die geografische Lage der Immobilie.