Methoden und Formeln für die Informationen zur Antwortvariablen für Random Forests® Regression

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Wenn Sie der Validierung von außerhalb des Segments für die Analyse eine Validierung mit einem Testdatensatz hinzufügen, enthält die Tabelle separate Statistiken für den Trainingsdatensatz und den Testdatensatz.

N

Die Tabelle enthält diese Statistik, wenn Sie die Validierung mit einem Testdatensatz hinzufügen. Die Zahlen geben an, wie viele nicht fehlende Antwortwerte sich in den Test- und Trainingsdatensätzen befinden.

% von N

Die Tabelle enthält diese Statistik, wenn Sie die Validierung mit einem Testdatensatz hinzufügen. Die Zahlen entsprechen dem Prozentsatz der Beobachtungen, die im Trainingsdatensatz und im Testdatensatz enthalten sind.

Mittelwert

Ein häufig verwendetes Maß für das Zentrum einer Gruppe von Zahlen. Der Mittelwert wird auch als Durchschnitt bezeichnet. Es handelt sich um die Summe aller Beobachtungen dividiert durch die Anzahl der (nicht fehlenden) Beobachtungen.

StdAbw

Enthält der Datensatz mit dem Mittelwert , dann ist die Standardabweichung der Stichprobe:
BegriffBeschreibung
Beobachtung
Mittelwert der Beobachtungen
NAnzahl der nicht fehlenden Beobachtungen

Minimum von

Der kleinste Wert im Datensatz.

Q1

25 % Ihrer Stichprobenbeobachtungen sind kleiner oder gleich dem Wert des 1. Quartils. Daher wird das 1. Quartil auch als das 25. Perzentil bezeichnet.

Median

Der Stichproben-Median liegt in der Mitte der Daten: Mindestens die Hälfte der Beobachtungen sind kleiner oder gleich und mindestens die Hälfte sind größer oder gleich dem Stichproben-Median.

Angenommen, ein Datensatz enthält N Werte. Um den Median zu berechnen, ordnen Sie die Datenwerte zunächst vom kleinsten zum größten an. Wenn N eine ungerade Zahl ist, handelt es sich bei dem Stichproben-Median um den Wert in der Mitte. Wenn N eine gerade Zahl ist, handelt es sich bei dem Stichproben-Median um den Durchschnitt der beiden mittleren Werte.

Q3

75 % Ihrer Stichprobenbeobachtungen sind kleiner oder gleich dem Wert des dritten Quartils. Daher wird das dritte Quartil auch als das 75. Perzentil bezeichnet.

Maximum

Der größte Wert im Datensatz.