Methoden und Formeln für Prozent der Fehlerstatistiken in Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression

Hinweis

Dieser Befehl ist mit dem Add-On-Modul „Prädiktive Analysen“ verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Für Prozent der Fehlerstatistiken hängt der Wert vom Prozentsatz der größten Residuen in der Berechnung ab. In den folgenden Formeln wird bei den Berechnungen davon ausgegangen, dass die Residuen nach dem Absolutwert geordnet sind, so dass i = 1 für das Residuum mit dem größten Absolutwert und i = N für das Residuum mit dem kleinsten Absolutwert steht.

Bei Verwendung der Kreuzvalidierung mit K Faltungen enthalten die Trainingsstatistiken die angepassten Werte aus dem endgültigen Baum für den vollständigen Datensatz. Die Teststatistiken verwenden angepasste Werte aus dem Validierungsprozess, der unterschiedliche Bäume für jede Faltung aufweisen kann.

Wird mit einem Testdatensatz validiert, verwenden die Teststatistiken nur die für den Testdatensatz angepassten Werte.

% MSE

% MAD

% MAPE

Notation

BegriffBeschreibung
cAnzahl der größten Residuen für Prozentsatz
yi beobachteter Wert der Antwortvariablen
Mittelwert der Antwortvariablen
angepasste Antwortvariable
NAnzahl der Zeilen