Diagramm der relativen Variablenwichtigkeit für CART® Klassifikation

Verwenden Sie das Diagramm der relativen Variablenwichtigkeit, um zu ermitteln, welche Prädiktoren die wichtigsten Variablen für den Klassifikationsbaum sind.

Das Diagramm „Relative Variablenwichtigkeit“ zeigt die Prädiktoren in der Reihenfolge ihrer Auswirkungen auf die Modellverbesserung. Eine wichtige Variable ist eine Variable, die als primärer oder Surrogat-Teiler im Baum verwendet wird. Die Variable mit dem höchsten Verbesserungswert wird als wichtigste Variable festgelegt, die übrigen Variablen folgen in der Reihenfolge ihrer Wichtigkeit. Bei der relativen Variablenwichtigkeit werden die Wichtigkeitswerte standardisiert, sodass sie leichter interpretiert werden können. Die relative Wichtigkeit ist definiert als die prozentuale Verbesserung in Bezug auf den wichtigsten Prädiktor, der eine Wichtigkeit von 100 % aufweist.

Die relative Wichtigkeit wird berechnet, indem die Wichtigkeitswerte aller Variablen durch den größten Wichtigkeitswert der Variablen dividiert werden und das Ergebnis mit 100 % multipliziert wird.

Interpretation

Die relative Variablenwichtigkeit kann Werte von 0 % bis 100 % annehmen. Die wichtigste Variable hat immer eine relative Wichtigkeit von 100 %. Wird eine Variable überhaupt nicht im Klassifikationsbaum verwendet, ist sie nicht wichtig.

In diesem Beispiel ist die wichtigste Prädiktorvariable „Brustschmerztyp“. Wenn Sie den Beitrag der obersten Prädiktorvariablen („Brustschmerztyp“) als 100 % zählen, dann hat die nächstwichtige Variable, „Hauptgefäße“, einen Beitrag von 86,5 %. Das heißt, dass „Hauptgefäße“ im ausgewählten Klassifikationsbaum 86,5 % so wichtig wie „Brustschmerztyp“ ist.