Auswählen der anzuzeigenden Grafiken für Random Forests®-Klassifikation

Predictive Analytics-Modul > Random Forests®-Klassifikation > Grafiken
Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Wählen Sie die Grafiken aus, die für die Analyse angezeigt werden sollen.

Diagramm der Fehlklassifikationsquote vs. Anzahl der Bäume
Das Diagramm der Fehlklassifizierungsrate vs. Anzahl der Bäume zeigt die Beziehung zwischen den Klassifikationsfehlern und der Anzahl der Bäume. Wenn Sie einen separaten Testdatensatz bereitstellen, enthält das Diagramm zwei Kurven für die Daten außerhalb des Segments und für den Testdatensatz.
Diagramm der Variablenwichtigkeit
Das Diagramm der Variablenwichtigkeit zeigt die relative Wichtigkeit der Prädiktoren. Sie können auswählen, ob alle wichtigen Variablen oder ausgewählte wichtige Variablen angezeigt werden sollen. Die Wichtigkeit von Variablen nimmt zu, wenn sie in der Analyse einen Knoten in einem beliebigen Baum teilen.
  • Alle wichtigen Variablen anzeigen: In der Standardeinstellung werden in diesem Diagramm alle wichtigen Variablen angezeigt.
  • Einen Prozentsatz der wichtigen Variablen anzeigen: Geben Sie den Prozentsatz der anzuzeigenden wichtigen Variablen an. Geben Sie einen Wert zwischen 0 und 100 ein.
  • Alle Prädiktorvariablen anzeigen: Es werden alle Prädiktoren angezeigt, wobei es keine Rolle spielt, ob es sich um wichtige Variablen handelt.
Methode zum Bilden der Rangfolge
Wählen Sie aus, wie Minitab die Werte der relativen Wichtigkeit für die Variablen im Diagramm der Variablenwichtigkeit berechnet. Für Permutation wertet Minitab aus, wie viel schlechter die Leistung des Modells ist, indem das Modell erneut mit den permutierten Werten einer Variablen im Diagramm validiert wird. Für Gini summiert Minitab die Verbesserungen, die die Variable für alle Bäume bewirkt. Permutation ist die Standardmethode für Datensätze mit höchstens 5000 Einträgen. Erwägen Sie, ob Sie Permutation für größere Datensätze verwenden sollten, wenn die Analyse nicht zu lange dauert und die Identifizierung wichtiger Prädiktoren ein wichtiges Ziel ist.
Grenzwertoptimierungskurve (ROC-Kurve)
Die Grenzwertoptimierungskurve (ROC-Kurve) zeigt die Fähigkeit eines Modells, zwischen Klassen zu unterscheiden. Die ROC-Kurve bildet die Richtig-Positiv-Rate (TPR) im Vergleich zur Falsch-Positiv-Rate (FPR) ab.
Gain-Diagramm
Das kumulierte Gain-Diagramm veranschaulicht die Effektivität des Modells in einem Anteil der Grundgesamtheit. Das Gain-Diagramm stellt die Richtig-Positiv-Rate in Prozent vs. % Grundgesamtheit dar.
Lift-Diagramm
Das Lift-Diagramm veranschaulicht die Effektivität des Prognosemodells. Im Diagramm ist der kumulative Lift im Vergleich zu % Grundgesamtheit abgebildet, und es wird die Differenz zwischen den Ergebnissen mit dem und ohne das Prognosemodell angezeigt. Sie können Kumulativ oder Nicht kumulativ für das Lift-Diagramm angeben.