Courbe de la fonction d’efficacité du récepteur (ROC) pour Ajuster le modèle logistique binaire

La courbe ROC représente le taux de vrais positifs (TPR), également appelé puissance, sur l’axe des Y. La courbe ROC représente le taux de faux positifs (FPR), également appelé erreur de type 1, sur l’axe des X. La zone située sous une courbe ROC indique si le modèle binaire est un bon classificateur.

Interprétation

La zone située sous les valeurs de la courbe ROC varie de 0,5 à 1. Lorsque le modèle binaire peut parfaitement séparer les classes, la zone située sous la courbe est de 1. Lorsque le modèle binaire ne peut pas séparer les classes plus efficacement qu’une affectation aléatoire, la zone située sous la courbe est de 0,5.

Lorsque aucun ensemble de test distinct n’est utilisé, Minitab crée la courbe ROC avec l’ensemble de données.

Dans cet exemple, la zone située sous la courbe de test est de 0,9405.

Avec une méthode de validation, Minitab crée deux courbes ROC. Une courbe représente les données d’apprentissage et l’autre les données de validation. Les résultats de validation indiquent si le modèle peut prédire de manière adaptée les valeurs de réponse pour les nouvelles observations, ou résumer correctement les relations entre les variables de réponse et de prédiction. Les résultats d’apprentissage sont généralement plus idéaux que réels et ne sont donnés qu’à titre de référence.

Une zone de K partitions sous la courbe ROC sensiblement inférieure à la zone sous la courbe ROC peut indiquer que le modèle est sur-ajusté. Un modèle est sur-ajusté s’il comprend des termes qui ne sont pas importants dans la population. Le modèle devient trop spécifiquement adapté aux données d'apprentissage et, par conséquent, pourrait ne pas être utile pour faire des prédictions sur la population.

Dans cet exemple, la courbe d’apprentissage indique un meilleur ajustement que la courbe de test. Les performances de la courbe de test représentent généralement mieux les performances du modèle pour de nouvelles données. La zone située sous la courbe de test est de 0,8882.