Gráfica de importancia relativa de variables para Clasificación Random Forests®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

La gráfica de importancia relativa de variables presenta los predictores en el orden de su efecto en la mejora del modelo cuando se realizan divisiones en un predictor basadas en el bosque completo. La variable con la puntuación de mejora más alta se establece como la variable más importante, y las otras variables siguen en orden de importancia. La importancia relativa de variables estandariza los valores de importancia para facilitar la interpretación. La importancia relativa se define como la mejora porcentual con respecto al predictor más importante, el cual tiene una importancia de 100%.

La importancia relativa se calcula dividiendo la puntuación de importancia de cada variable entre la mayor puntuación de importancia de las variables, y luego multiplicamos por 100%.

Interpretación

Los valores de importancia relativa de variables oscilan entre 0% y 100%. La variable más importante siempre tiene una importancia relativa de 100%. Si una variable no está se utiliza en ninguno de los árboles, entonces la variable no es importante.

Minitab utiliza dos métodos para calcular las puntuaciones de importancia relativa para las variables en la gráfica de importancia de variables. Para Permutación, Minitab evalúa qué tanto empeora el rendimiento del modelo cuando se vuelve a validar el modelo con los valores permutados de una variable en la gráfica. Para Gini, Minitab suma las mejoras que la variable realiza para todos los árboles. Permutación es el método predeterminado para conjuntos de datos con 5000 o menos registros. Considere si es recomendable utilizar Permutación para conjuntos de datos más grandes cuando el análisis no tarde demasiado y la identificación de los predictores importantes sea un objetivo importante.

La variable predictora más importante es Grandes vasos. Si la contribución de la variable predictora más importante, Grandes vasos, es 100%, entonces la siguiente variable importante, Thal, tiene una contribución del 89.7%. Esto significa que Thal es 89.7% tan importante como Grandes vasos en este modelo de clasificación.