Methoden und Formeln für Prozent der Fehlerstatistiken aufgrund der größten Residuen in CART® Regression

Wählen Sie die gewünschte Methode oder Formel aus.

Für Prozent der Fehlerstatistiken hängt der Wert vom Prozentsatz der größten Residuen in der Berechnung ab. In den folgenden Formeln wird bei den Berechnungen davon ausgegangen, dass die Residuen nach dem absoluten Wert sortiert sind, sodass i = 1 das Residuum mit dem größten absoluten Wert darstellt und i = N das Residuum mit dem geringsten absoluten Wert darstellt.

Bei Verwendung der Kreuzvalidierung mit K Faltungen enthalten die Trainingsstatistiken die angepassten Werte aus dem endgültigen Baum für den vollständigen Datensatz. Die Teststatistiken verwenden angepasste Werte aus dem Validierungsprozess, der unterschiedliche Bäume für jede Faltung aufweisen kann.

Wird mit einem Testdatensatz validiert, verwenden die Teststatistiken nur die für den Testdatensatz angepassten Werte.

% MSE

% MAD

% MAPE

Notation

BegriffBeschreibung
cZählung der größten Residuen für den prozentualen
yi i -ter beobachteter Ansprechwert
mittlere Antwort
i -ter angepasste Antwort
NAnzahl der Datensätze