Gain-Diagramm und Lift-Diagramm für CART® Klassifikation

Verwenden Sie das Gain- und das Lift-Diagramm, um die Leistung Ihres Klassifikationsmodells auszuwerten. Das Gain-Diagramm zeigt die gesamte Positiv-Rate in Prozent im Vergleich zum Prozentsatz der Gesamtanzahlen. So können diese Diagramme beispielsweise zeigen, dass 80 % der Ereignisse in 20 % der Daten auftreten. Wenn Sie sich also auf 20 % der Daten konzentrieren, schont dies Ihre Ressourcen. Das Lift-Diagramm zeigt den kumulativen Lift (oder den nicht kumulativen Lift) im Vergleich zum Prozentsatz der Gesamtanzahlen.

Interpretation des Gain-Diagramms

Die Trainings- und Testlinien stellen den erwarteten Wert der Antwortvariablen unter Verwendung des Prognosemodells dar. Der Trainingsdatensatz wird zum Anpassen des Modells, der Testdatensatz zum Auswerten des Modells genutzt. Die gepunktete Referenzlinie stellt eine Linie mit einer Steigung von 1 dar. Dies entspricht der erwarteten Zufallsantwort ohne das Modell. Ein Gain größer als 1 weist darauf hin, dass die Ergebnisse des Prognosemodells besser als rein zufällig sind.

In diesem Beispiel zeigt das Gain-Diagramm einen starken Anstieg über die Referenzlinie und flacht dann ab. In diesem Fall erklären etwa 40 % der Daten ungefähr 70 % der richtig Positiven.

Interpretation des Lift-Diagramms

Die Trainings- und Testlinien stellen den erwarteten Wert der Antwortvariablen unter Verwendung des Prognosemodells dar. Der Trainingsdatensatz wird zum Anpassen des Modells, der Testdatensatz zum Auswerten des Modells genutzt. Der Lift ist das Verhältnis zwischen dem Gain-Prozentsatz und dem erwarteten Zufallsergebnis. Die gepunktete Referenzlinie stellt einen kumulativen Lift von 1 dar, was bedeutet, dass es keinen Gewinn im Vergleich zum Zufallswert gibt.

In diesem Beispiel zeigt das Lift-Diagramm einen Anstieg über die Referenzlinie und fällt dann ab.