Graphique d’importance relative des variables pour Classification CART®

Utilisez le graphique d’importance relative des variables pour déterminer quels prédicteurs sont les variables les plus importantes pour l’arbre de classification.

Le graphique Importance relative des variables trace les prédicteurs dans l’ordre de leur effet sur l’amélioration du modèle. Une variable importante est une variable qui est utilisée comme séparateur principal ou de substitution dans l’arbre. La variable avec le score d’amélioration le plus élevé est définie comme la variable la plus importante, et les autres variables suivent par ordre d’importance. L’importance des variables relatives normalise les valeurs d’importance pour faciliter l’interprétation. L’importance relative est définie comme le pourcentage d’amélioration par rapport au prédicteur le plus important, qui a une importance de 100 %.

L’importance relative est calculée en divisant chaque score d’importance de variable par le score d’importance le plus élevé des variables, puis nous multiplions par 100 %.

Interprétation

Les valeurs d’importance relative des variables sont comprises entre 0 % et 100 %. La variable la plus importante a toujours une importance relative de 100 %. Si une variable n’est pas du tout utilisée dans l’arbre de classification, elle n’a pas d’importance.

Dans cet exemple, la variable prédictive la plus importante est le type de douleur thoracique. Si vous comptez la contribution de la variable prédictive principale, le type de douleur thoracique, comme 100 %, alors la variable importante suivante, les vaisseaux majeurs, a une contribution de 86,5 %. Cela signifie que les vaisseaux principaux sont 86,5 % aussi importants que le type de douleur thoracique dans l’arbre de classification que vous avez choisi.