Courbe d'importance relative des variables pour la fonction Classification CART®

Utilisez la courbe d’importance relative des variables pour déterminer quels prédicteurs sont les variables les plus importantes pour l’arbre de classification.

Le graphique d'importance relative des variables trace les prédicteurs dans l'ordre de leur effet sur l'amélioration du modèle. Une variable importante est une variable qui est utilisée comme séparateur principal ou de substitution dans l'arbre. La variable avec le score d'amélioration le plus élevé est la variable la plus importante, et les autres variables suivent par ordre d'importance. L'importance relative des variables normalise les valeurs d'importance pour faciliter l'interprétation. L'importance relative se définit comme l'amélioration en pourcentage par rapport au prédicteur le plus important, qui a une importance de 100 %.

L’importance relative est calculée en divisant chaque score d’importance des variables par le plus grand score d’importance des variables. Le résultat est ensuite multiplié par 100 %.

Interprétation

Les valeurs d'importance relative des variables varient de 0 % à 100 %. La variable la plus importante a toujours une importance relative de 100 %. Si une variable n’est pas du tout utilisée dans l’arbre de classification, cela signifie qu’elle n’est pas importante.

Dans cet exemple, la variable de prédiction la plus importante est le type de douleur thoracique. Si vous dénombrez à 100 % la contribution de la variable de prédiction supérieure, c’est-à-dire Type de douleur thoracique, alors la variable importante suivante, Principaux vaisseaux, présente une contribution de 86,5 %. Ainsi, les principaux vaisseaux sont à 86,5 % aussi importants que le type de douleur thoracique dans l’arbre de classification choisi.