Courbe des caractéristiques de fonctionnement du récepteur (ROC) pour Ajuster le modèle logistique binaire et Regressão Logística Binária

La courbe ROC trace le taux de positivité réelle (TPR), également connu sous le nom de puissance, sur l’axe des y. La courbe ROC trace le taux de faux positifs (FPR), également connu sous le nom d’erreur de type 1, sur l’axe des x. L’aire sous une courbe ROC indique si le modèle binaire est un bon classificateur.

Interprétation

Les valeurs de l’aire sous la courbe ROC sont comprises entre 0,5 et 1. Lorsque le modèle binaire peut parfaitement séparer les classes, alors l’aire sous la courbe est 1. Lorsque le modèle binaire ne peut pas séparer les classes mieux qu’une affectation aléatoire, alors l’aire sous la courbe est de 0,5.

Lorsqu’aucun jeu de test distinct n’est utilisé, Minitab crée la courbe ROC avec le jeu de données.

Dans cet exemple, l’aire sous la courbe de test est de 0,9405.

À l’aide d’une méthode de validation, Minitab crée deux courbes ROC. Une courbe concerne les données d’entraînement et l’autre les données de validation. Les résultats de la validation indiquent si le modèle peut prédire correctement les valeurs de réponse pour les nouvelles observations ou résumer correctement les relations entre la réponse et les variables prédictives. Les résultats de l’entraînement sont généralement plus idéaux que réels et ne sont donnés qu’à titre indicatif.

Une aire de pliage k sous la courbe ROC qui est nettement inférieure à l’aire sous la courbe ROC peut indiquer que le modèle est surajusté. Un modèle de surajustement se produit lorsque le modèle inclut des termes qui ne sont pas importants dans la population. Le modèle est adapté aux données d’entraînement et, par conséquent, peut ne pas être utile pour faire des prédictions sur la population.

Dans cet exemple, la courbe d’entraînement montre un meilleur ajustement que la courbe de test. Les performances de la courbe de test sont généralement une meilleure représentation de la performance du modèle pour les nouvelles données. L’aire sous la courbe d’essai est de 0,8882.