Gráfica de Importancia relativa de las variables para Clasificación CART®

Utilice la gráfica de Importancia relativa de las variables para determinar cuáles predictores son las variables más importantes para el árbol de clasificación.

La gráfica de Importancia relativa de las variables traza los predictores en orden de su efecto en la mejora del modelo. Una variable importante es una variable que se utiliza como divisor principal o sustituto en el árbol. La variable con la puntuación de mejora más alta se establece como la variable más importante, y las otras variables siguen en orden de importancia. La Importancia relativa de las variables estandariza los valores de importancia para facilitar la interpretación. La importancia relativa se define como la mejora porcentual con respecto al predictor más importante, el cual tiene una importancia de 100%.

La importancia relativa se calcula dividiendo la puntuación de importancia de cada variable entre la mayor puntuación de importancia de las variables, y luego multiplicamos por 100%.

Interpretación

Los valores de importancia relativa de la variable oscilan entre 0% y 100%. La variable más importante siempre tiene una importancia relativa de 100%. Si una variable no se utiliza en absoluto en el árbol de clasificación, no es importante.

En este ejemplo, la variable predictora más importante es Tipo de dolor de pecho. Si cuenta la contribución de la variable predictora superior, Tipo de dolor de pecho, como 100%, entonces la siguiente variable importante, Vasos principales, tiene una contribución del 86.5%. Esto significa que Vasos principales tiene el 86.5% de la importancia que tiene Tipo de dolor de pecho en el árbol de clasificación elegido.