Tabelle mit der Zusammenfassung des Modells für Random Forests®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Hier finden Sie Definitionen und Anleitungen zur Interpretation für die Tabelle mit der Zusammenfassung des Modells. Wenn Sie die Validierung mit einem Testdatensatz zur Validierung mit den Daten außerhalb des Segments hinzufügen, zeigt Minitab die Ergebnisse für beide Validierungsmethoden an.

Prädiktoren gesamt

Die Gesamtzahl der für das Random Forests®-Modell verfügbaren Prädiktoren. Die Gesamtzahl ist die Summe der angegebenen stetigen und kategorialen Prädiktoren.

Wichtige Prädiktoren

Die Anzahl der wichtigen Prädiktoren im Random Forests®-Modell. Wichtige Prädiktoren haben Wichtigkeitswerte, die größer als 0 sind. Mit dem Diagramm „Relative Variablenwichtigkeit“ können Sie die Rangfolge der relativen Variablenwichtigkeit anzeigen. Wenn z. B. 10 von 20 Prädiktoren im Modell wichtig sind, werden die Variablen im Diagramm „Relative Variablenwichtigkeit“ in der Reihenfolge ihrer Wichtigkeit angezeigt.

Durchschnittliche –Log-Likelihood

Bei einer binären Antwortvariablen berechnet Minitab den Durchschnitt der negativen Log-Likelihood. Vergleichen Sie die durchschnittlichen –Log-Likelihood-Werte aus verschiedenen Modellen, um das am besten passende Modell zu bestimmen. Sie können diese Statistik auch verwenden, um Modelle aus anderen Befehlen zu vergleichen, zum Beispiel CART® Klassifikation und TreeNet®-Klassifikation. Niedrigere durchschnittliche –Log-Likelihood-Werte weisen auf eine bessere Anpassung hin.

Fläche unterhalb der ROC-Kurve

Die ROC-Kurve zeigt die Richtig-Positiv-Rate (TPR), auch als Trennschärfe bezeichnet, auf der y-Achse. Die ROC-Kurve zeigt die Falsch-Positiv-Rate (FPR), auch als Fehler 1. Art bezeichnet, auf der x-Achse. Die Fläche unter einer ROC-Kurve gibt an, ob der Klassifikationsbaum ein guter Klassifikator ist.

Bei Klassifikationsbäumen nimmt die Fläche unter der ROC-Kurve in der Regel Werte von 0,5 bis 1 an. Je größer die Werte, desto besser ist das Klassifikationsmodell. Wenn das Modell die Klassen perfekt trennen kann, entspricht die Fläche unter der Kurve 1. Wenn das Modell die Klassen nicht besser als eine zufällige Einteilung trennen kann, entspricht die Fläche unter der Kurve 0,5.

Lift

Bei einer binären Antwortvariablen zeigt Minitab den Lift an. Der Lift ist der kumulative Lift für die 10 % der Daten mit der besten Chance auf eine korrekte Klassifikation.

Der Lift stellt das Verhältnis der des Sollwerts der Antwortvariablen dividiert durch die den durchschnittlichen Wert der Antwortvariablen dar. Wenn der Lift größer als 1 ist, weist ein Segment der Daten einen größeren Wert der Antwortvariablen als erwartet auf.

Fehlklassifizierungsrate

Die Fehlklassifizierungsrate gibt an, wie oft das Modell die Ereignisse und Nicht-Ereignisse richtig klassifiziert. Kleinere Werte weisen auf eine bessere Leistung hin.