Gain-Diagramm und Lift-Diagramm für Random Forests®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Verwenden Sie das Gain- und das Lift-Diagramm, um die Leistung Ihres Klassifikationsmodells auszuwerten. Das Gain-Diagramm zeigt die wahre Positiv-Rate in Prozent im Vergleich zum Prozentsatz der Gesamtanzahlen. Das Lift-Diagramm zeigt den kumulativen Lift (oder den nicht kumulativen Lift) im Vergleich zum Prozentsatz der Gesamtanzahlen.

Interpretation des Gain-Diagramms

Die Linie von außerhalb des Segments stellt den erwarteten Wert der Antwortvariablen unter Verwendung des Prognosemodells dar. Die gepunktete Referenzlinie stellt eine Linie mit einer Steigung von 1 dar. Dies entspricht der erwarteten Zufallsantwort ohne das Modell.

In diesem Beispiel zeigt das Gain-Diagramm einen starken Anstieg über die Referenzlinie und flacht dann ab. In diesem Fall sind rund 40 % der Daten für rund 78% der Richtig-Positiven verantwortlich. Das heißt, wenn ein Unternehmen auf der Grundlage des Modells die entsprechenden 20 % der Bevölkerung anvisiert, beträgt die Richtig-Positiv-Rate etwa 40 %. Ohne das Modell beträgt der entsprechende Prozentsatz 20 %. Diese Differenz entspricht dem zusätzlichen Gain, der aus der Verwendung des Modells resultiert.

Interpretation des Lift-Diagramms

Die Linie von außerhalb des Segments stellt den erwarteten Wert der Antwortvariablen unter Verwendung des Prognosemodells dar. Der Lift ist das Verhältnis zwischen dem Gain-Prozentsatz und dem erwarteten Zufallsergebnis. Die gepunktete Referenzlinie stellt einen kumulativen Lift von 1 dar, was bedeutet, dass es keinen Gewinn im Vergleich zur zufälligen Zuordnung gibt.

In diesem Beispiel zeigt das Lift-Diagramm einen starken Anstieg über die Referenzlinie und fällt dann ab. Wenn wir also mit diesem Modell die 10 % der Kunden mit den höchsten prognostizierten Antwortwahrscheinlichkeiten kontaktieren, erwarten wir mehr als doppelt so viele Antworten, wie wir erwarten würden, wenn wir 10 % der Kunden zufällig kontaktieren würden.