Courbe des gains et courbe de lift pour Classification Random Forests®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Utilisez les courbes des gains et de lift pour évaluer les performances de votre modèle de classification. La courbe des gains indique le taux de vrais positifs en pourcentage par rapport au pourcentage de dénombrements totaux. La courbe de lift représente le lift cumulé (ou non cumulé) par rapport au pourcentage de dénombrements totaux.

Interprétation de la courbe des gains

Les lignes out-of-bag représentent la réponse attendue en utilisant le modèle prédictif. La ligne de référence pointillée représente une ligne de pente égale à 1, qui est la réponse aléatoire attendue sans le modèle.

Dans cet exemple, la courbe des gains augmente fortement au-dessus de la ligne de référence, puis s'aplatit. Dans ce cas, environ 40 % des données représentent environ 78% des vrais positifs. Ainsi, si une entreprise cible les 20 % de la population indiqués par le modèle, le taux de vrais positifs est d'environ 40 %. Sans le modèle, le pourcentage correspondant est de 20 %. Cette différence est le gain supplémentaire dû à l'utilisation du modèle.

Interprétation de la courbe de lift

Les lignes out-of-bag représentent la réponse attendue en utilisant le modèle prédictif. Le lift correspond au rapport entre le pourcentage des gains et le résultat aléatoire attendu. La ligne de référence pointillée représente un lift cumulé de 1, ce qui signifie qu'il n'y a pas de gain par rapport à l'affectation aléatoire.

Dans cet exemple, la courbe de lift augmente fortement au-dessus de la ligne de référence, puis redescend progressivement. Ainsi, d'après ce modèle, si nous contactons 10 % de clients à probabilités de réponse les plus élevées prévues, nous nous attendons à recevoir plus de deux fois plus de réponses que ce qui serait attendu si nous avons contacté 10 % des clients au hasard.