Modellvalidierung

Random Forests®-Klassifikation verwendet für jede Analyse eine Validierung mit Daten von außerhalb des Segments. Wenn Sie die Validierung mit einem Testdatensatz zusätzlich zur Validierung mit Daten von außerhalb des Segments auswählen, zeigt die Tabelle die Spalte an, die den Testdatensatz oder den Prozentsatz der Daten in den Test- und Trainingsdatensätzen identifiziert.

Anzahl der Bootstrap-Stichproben

Die Anzahl der Bootstrap-Stichproben gibt die Anzahl der Bäume in der Analyse an. Wenn Sie die einzige Validierung mit Daten von außerhalb des Segments verwenden, entspricht der Stichprobenumfang der Anzahl der Zeilen in der Analyse. Wenn Sie die Validierung mit einem Testdatensatz verwenden, entspricht der Standardstichprobenumfang dem Umfang der Trainingsdaten. Wenn Sie einen Stichprobenumfang verwenden möchten, der kleiner als der Trainingsdatenumfang ist, wird dieser Umfang in der Tabelle angezeigt.

Anzahl der für die Knotenteilung ausgewählten Prädiktoren

Diese Zeile gibt an, ob bei der Knotenteilung an jedem Knoten jeder Prädiktor oder eine zufällige Teilmenge von Prädiktoren berücksichtigt wird. Wird bei der Knotenteilung eine zufällige Teilmenge verwendet, zeigt diese Zeile die ausgewählte Anzahl von Prädiktoren an, die berücksichtigt werden sollen.

Wenn Sie anfänglich alle Prädiktoren verwenden, erwägen Sie, in nachfolgenden Modellen eine Teilmenge von Prädiktoren zu verwenden, um die Leistung der Modelle zu vergleichen.

Minimale interne Knotengröße

Die minimale interne Knotengröße gibt die minimale Anzahl von Fällen an, die ein Knoten aufweisen kann, wenn er immer noch in weitere Knoten geteilt werden kann. Wenn die Leistung des Modells nicht ausreichend ist, ziehen Sie in Betracht, diesen Wert zu erhöhen, um zu sehen, wie sich dies auf die Leistung auswirkt.

Strafe für fehlenden Wert

Standardmäßig hat die Analyse keine Strafe für den fehlenden Wert, und diese Zeile ist nicht vorhanden. Durch die Strafe für den fehlenden Wert erhalten Prädiktorvariablen anhand des Anteils der fehlenden Werte Abzüge. Eine Variable mit einer hohen Strafe wird weniger wahrscheinlich als Teiler für einen Knoten ausgewählt.

Strafe für Kategorie auf hoher Stufe

Standardmäßig hat die Analyse keine Strafe für Kategorie auf hoher Stufe, und diese Zeile ist nicht vorhanden. Durch die Strafe für eine Kategorie auf hoher Stufe erhalten Variablen entsprechend der Anzahl der kategorialen Stufen relativ zur Größe des Knotens für jeden Knoten einen Abzug. Daher ist es weniger wahrscheinlich, dass ein Konkurrent mit vielen Stufen in einem Knoten, den primären Teiler darstellt.

Verwendete Zeilen

Die Anzahl der in der Analyse enthaltenen Beobachtungen in der Antwortvariablen.

Nicht verwendete Zeilen

Die Anzahl der fehlenden Beobachtungen in der Antwortvariablen.

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien