Methoden und Formeln für Prozent der Fehlerstatistiken in Random Forests® Regression

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Für Prozent der Fehlerstatistiken hängt der Wert vom Prozentsatz der größten Residuen in der Berechnung ab. In den folgenden Formeln wird bei den Berechnungen davon ausgegangen, dass die Residuen nach dem Absolutwert geordnet sind, so dass i = 1 für das Residuum mit dem größten Absolutwert und i = N für das Residuum mit dem kleinsten Absolutwert steht.

Bei der Validierung von außerhalb des Segments ergibt sich die Anpassung für eine Zeile aus dem Durchschnitt der Prognosen, wenn die Zeile in den Daten von außerhalb des Segments enthalten ist.

Wird mit einem Testdatensatz validiert, verwenden die Teststatistiken nur die für den Testdatensatz angepassten Werte.

% MSE

% MAD

% MAPE

Notation

BegriffBeschreibung
cAnzahl der größten Residuen für Prozentsatz
yi beobachteter Wert der Antwortvariablen
Mittelwert der Antwortvariablen
angepasste Antwortvariable
NAnzahl der Zeilen