La courbe ROC trace le taux de positivité réelle (TPR), également connu sous le nom de puissance, sur l’axe des y. La courbe ROC trace le taux de faux positifs (FPR), également connu sous le nom d’erreur de type 1, sur l’axe des x. L’aire sous une courbe ROC indique si le modèle binaire est un bon classificateur.
Les valeurs de l’aire sous la courbe ROC sont comprises entre 0,5 et 1. Lorsque le modèle binaire peut parfaitement séparer les classes, alors l’aire sous la courbe est 1. Lorsque le modèle binaire ne peut pas séparer les classes mieux qu’une affectation aléatoire, alors l’aire sous la courbe est de 0,5.
À l’aide d’une méthode de validation, Minitab crée deux courbes ROC. Une courbe concerne les données d’entraînement et l’autre les données de validation. Les résultats de la validation indiquent si le modèle peut prédire correctement les valeurs de réponse pour les nouvelles observations ou résumer correctement les relations entre la réponse et les variables prédictives. Les résultats de l’entraînement sont généralement plus idéaux que réels et ne sont donnés qu’à titre indicatif.
Une aire de pliage k sous la courbe ROC qui est nettement inférieure à l’aire sous la courbe ROC peut indiquer que le modèle est surajusté. Un modèle de surajustement se produit lorsque le modèle inclut des termes qui ne sont pas importants dans la population. Le modèle est adapté aux données d’entraînement et, par conséquent, peut ne pas être utile pour faire des prédictions sur la population.