Tableau de gain et graphique d’élévation pour Classification CART®

Utilisez les graphiques Gain et Lift pour évaluer les performances de votre modèle de classification. Le graphique Gain représente le taux total de positivité en pourcentage par rapport au pourcentage du nombre total. Ainsi, par exemple, ces graphiques peuvent montrer que 80 % des événements se trouvent dans 20 % des données. Ainsi, en nous concentrant sur 20% des données, nous pouvons être efficaces avec nos ressources. Le graphique Courbes d’élévation représente l’augmentation cumulative (ou l’augmentation non cumulative) en fonction du pourcentage des nombres totaux.

Interprétation du graphique de gain

Les lignes d’entraînement et de test représentent la réponse attendue à l’aide du modèle prédictif. L’ensemble de données d’entraînement s’adapte au modèle et l’ensemble de données de test évalue le modèle. La ligne de référence pointillée représente une droite avec pente = 1, qui est la réponse aléatoire attendue sans le modèle. Les gains supérieurs à 1 indiquent que les résultats du modèle prédictif sont meilleurs que aléatoires.

Dans cet exemple, le graphique de gain montre une forte augmentation au-dessus de la ligne de référence, puis un aplatissement. Dans ce cas, environ 40 % des données représentent environ 70 % des vrais positifs.

Interprétation de la courbe d’élévation

Les lignes d’entraînement et de test représentent la réponse attendue à l’aide du modèle prédictif. L’ensemble de données d’entraînement s’adapte au modèle et l’ensemble de données de test évalue le modèle. La portance est le rapport entre le pourcentage de gain et le résultat aléatoire attendu. La ligne de référence pointillée représente une levée cumulée de 1, ce qui signifie qu’il n’y a pas de gain par rapport à l’aléatoire.

Dans cet exemple, le graphique d’élévation montre une augmentation au-dessus de la ligne de référence qui diminue progressivement.