Courbe d'importance relative des variables pour Classification Random Forests®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Le graphique d'importance relative des variables trace les prédicteurs dans l'ordre de leur effet sur l'amélioration du modèle lors de division sur un prédicteur dans la totalité de la forêt. La variable ayant le score d'amélioration le plus élevé est prise comme la plus importante, et les autres variables suivent par ordre d'importance. L'importance relative des variables normalise les valeurs d'importance pour faciliter l'interprétation. L'importance relative se définit comme l'amélioration en pourcentage par rapport au prédicteur le plus important, qui a une importance de 100 %.

L’importance relative est calculée en divisant chaque score d’importance des variables par le plus grand score d’importance des variables. Le résultat est ensuite multiplié par 100 %.

Interprétation

Les valeurs d'importance relative des variables varient de 0 % à 100 %. La variable la plus importante a toujours une importance relative de 100 %. Si une variable n'est pas utilisée dans un arbre, c'est qu'elle n'est pas importante.

Minitab utilise deux méthodes pour calculer les scores d'importance relative des variables sur la courbe d'importance des variables. Pour Permutation, Minitab évalue le degré de dégradation du modèle en le validant à nouveau avec les valeurs permutées d'une variable sur la courbe. Pour Gini, Minitab additionne les améliorations apportées par la variable pour tous les arbres. Permutation est la méthode par défaut pour les fichiers de données avec 5 000 enregistrements ou moins. Voyez s'il est nécessaire d'utiliser Permutation pour les fichiers de données plus volumineux lorsque l'analyse ne prend pas trop de temps et que l'identification de prédicteurs importants est un objectif important.

La variable de prédiction la plus importante est Principaux vaisseaux. Si la contribution de la principale variable de prédiction, c'est-à-dire Principaux vaisseaux, est de 100 %, alors la variable d'importance suivante dans cet exemple, Thal, a une contribution de 89,7 %. Ainsi, Thal est à 89,7 % aussi importante que Principaux vaisseaux dans ce modèle de classification.