Tableau récapitulatif du modèle pour Classification Random Forests®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Trouvez des définitions et des pistes d’interprétation pour le tableau récapitulatif du modèle. Si vous ajoutez la validation avec un fichier de test à la validation avec les données out-of-bag, Minitab affiche les résultats pour les deux méthodes de validation.

Nombre total de prédicteurs

Nombre total de prédicteurs disponibles pour le modèle Random Forests®. Le total correspond à la somme des prédicteurs continus et de catégorie que vous spécifiez.

Prédicteurs importants

Nombre de prédicteurs importants dans le modèle Random Forests®. Les prédicteurs importants ont des scores d'importance supérieurs à 0. Vous pouvez utiliser la courbe d'importance relative des variables pour afficher l'ordre d'importance relative des variables. Par exemple, supposons que 10 des 20 prédicteurs soient importants dans le modèle, la courbe d'importance relative des variables affiche les variables dans l'ordre d'importance.

Moyenne du log de vraisemblance

Minitab calcule la moyenne de log négatif de vraisemblance lorsque la réponse est binaire. Comparez les valeurs moyennes de log de vraisemblance pour différents modèles afin de trouver celui qui convient le mieux. Vous pouvez également utiliser cette statistique pour comparer les modèles d’autres commandes, telles que Classification CART® et Classification TreeNet®. Les valeurs moyennes de log de vraisemblance plus basses indiquent un meilleur ajustement.

Aire sous la courbe ROC

La courbe ROC représente le taux de vrais positifs (TPR), également appelé puissance, sur l'axe Y. La courbe ROC représente le taux de faux positifs (FPR), également appelé erreur de type 1, sur l'axe X. L'aire sous une courbe ROC indique si l’arbre de classification est un bon classificateur.

Pour les arbres de classification, l'aire sous les valeurs de la courbe ROC varie généralement de 0,5 à 1. Plus les valeurs sont élevées, meilleure est la classification du modèle. Lorsque le modèle peut parfaitement séparer les classes, l'aire sous la courbe est de 1. Lorsque le modèle ne peut pas séparer les classes plus efficacement qu'une affectation aléatoire, l'aire sous la courbe est de 0,5.

Lift

Minitab affiche le lift lorsque la réponse est binaire. Le lift correspond au lift cumulé pour les 10 % des données ayant les meilleures chances de classification correcte.

Le lift représente le rapport de la réponse cible divisée par la réponse moyenne. Lorsque le lift est supérieur à 1, un segment des données a une réponse supérieure à la prédiction.

Taux de mauvais classement

Le taux de mauvais classement indique la fréquence à laquelle le modèle classe correctement les événements et les non-événements. Des valeurs plus petites indiquent de meilleures performances.