Courbe d'importance relative des variables pour Régression Random Forests®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Le graphique d'importance relative des variables trace les prédicteurs dans l'ordre de leur effet sur l'amélioration du modèle lors de division sur un prédicteur dans la totalité de la forêt. La variable ayant le score d'amélioration le plus élevé est prise comme la plus importante, et les autres variables suivent par ordre d'importance. L'importance relative des variables normalise les valeurs d'importance pour faciliter l'interprétation. L'importance relative se définit comme l'amélioration en pourcentage par rapport au prédicteur le plus important, qui a une importance de 100 %.

L’importance relative est calculée en divisant chaque score d’importance des variables par le plus grand score d’importance des variables. Le résultat est ensuite multiplié par 100 %.

Interprétation

Les valeurs d'importance relative des variables varient de 0 % à 100 %. La variable la plus importante a toujours une importance relative de 100 %. Si une variable n'est pas du tout utilisée dans le modèle, cela signifie qu'elle n'est pas importante.

La variable de prédiction la plus importante pour prédire le prix de vente est la qualité. Si l'importance de la principale variable de prédiction, Qualité, est de 100 %, alors la variable importante suivante, Surface habitable, présente une contribution de 88,8%. Ceci signifie que la surface habitable est 88,8 % aussi importante que la qualité générale du bien. La prochaine variable la plus importante est Quartier qui a une contribution de 52,6%.