Utilisez les courbes des gains et de lift pour évaluer les performances de
votre modèle de classification. La courbe des gains indique le taux de totaux
positifs en pourcentage par rapport au pourcentage de dénombrements totaux. Par
exemple, ces courbes peuvent montrer que 80 % des événements ont lieu dans 20 %
des données. Ainsi, en vous concentrant sur 20 % des données, vous pouvez
optimiser l'utilisation de vos ressources. La courbe de lift représente le lift
cumulé (ou non cumulé) par rapport au pourcentage de dénombrements totaux.
Interprétation de la courbe des gains
Les lignes d'apprentissage et de test représentent la réponse attendue en
utilisant le modèle prédictif. L'ensemble de données d'apprentissage ajuste le
modèle et l'ensemble de données de test l'évalue. La ligne de référence
pointillée représente une ligne avec une pente égale à 1, ce qui correspond à
la réponse aléatoire attendue sans le modèle. Les gains supérieurs à 1
indiquent que les résultats du modèle prédictif sont meilleurs que les
résultats aléatoires.
Dans cet exemple, la courbe des gains augmente fortement au-dessus
de la ligne de référence, puis ralentit. Dans ce cas, environ 40 % des données
représentent environ 70 % des vrais positifs.
Interprétation de la courbe de lift
Les lignes d'apprentissage et de test représentent la réponse attendue en
utilisant le modèle prédictif. L'ensemble de données d'apprentissage ajuste le
modèle et l'ensemble de données de test l'évalue. Le lift correspond au rapport
entre le pourcentage des gains et le résultat aléatoire attendu. La ligne de
référence pointillée représente un lift cumulé de 1, ce qui signifie qu'il
n'existe pas de gains par rapport au résultat aléatoire.
Dans cet exemple, la courbe de lift augmente au-dessus de la ligne
de référence, puis ralentit progressivement.