Sélectionner des graphiques à afficher pour Classification Random Forests®

Module d'analyse prédictive > Classification Random Forests® > Graphiques
Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Sélectionnez les graphiques à afficher pour l'analyse.

Diagramme de taux de mauvais classement par rapport au nombre d'arbres
Le diagramme de taux de mauvais classement par rapport au nombre d'arbres montre la relation entre les erreurs de classement et la quantité d'arbres. Si vous fournissez un ensemble de test distinct, le diagramme comprendra une courbe pour les données out-of-bag et une courbe pour l'ensemble de test.
Courbe d'importance des variables
La courbe d’importance des variables montre l’importance relative des prédicteurs. Vous pouvez choisir d'afficher toutes les variables importantes ou seulement certaines. Les variables augmentent en importance lorsqu'elles divisent un nœud dans n'importe quel arbre de l'analyse.
  • Afficher toutes les variables importantes : par défaut, cette courbe affiche toutes les variables importantes.
  • Afficher un pourcentage de variables importantes : spécifiez le pourcentage de variables importantes à afficher. Saisissez une valeur comprise entre 0 et 100.
  • Afficher toutes les variables de prédiction : affichez tous les prédicteurs, qu'ils constituent ou non des variables importantes.
Méthode de classement
Sélectionnez la façon dont Minitab calcule les scores d'importance relative pour les variables de la courbe d'importance des variables. Pour Permutation, Minitab évalue le degré de dégradation du modèle en le validant à nouveau avec les valeurs permutées d'une variable sur la courbe. Pour Gini, Minitab additionne les améliorations apportées par la variable pour tous les arbres. Permutation est la méthode par défaut pour les ensembles de données avec 5 000 enregistrements ou moins. Déterminez s'il est nécessaire d'utiliser la méthode Permutation pour les ensembles de données plus volumineux lorsque l'analyse ne prend pas trop de temps et que l'identification de prédicteurs importants constitue un objectif important.
Courbe de la fonction d'efficacité du récepteur (ROC)
La fonction d'efficacité du récepteur (courbe ROC) montre la capacité d'un modèle à distinguer les classes. La courbe ROC représente le taux de vrais positifs (TPR) en fonction du taux de faux positifs (FPR).
Courbe des gains
La courbe des gains cumulés illustre l’efficacité du modèle dans une partie de la population. La courbe des gains indique le taux de vrais positifs en pourcentage en fonction du pourcentage de la population.
Courbe de lift
La courbe de lift illustre l’efficacité du modèle prédictif. La courbe représente le lift cumulé par rapport à la population en pourcentage et affiche la différence entre les résultats obtenus avec et sans le modèle prédictif. Vous pouvez spécifier Cumulée ou Non cumulée pour la courbe de lift.