Für Prozent der Fehlerstatistiken hängt der Wert vom Prozentsatz der größten Residuen in der Berechnung ab. In den folgenden Formeln wird bei den Berechnungen davon ausgegangen, dass die Residuen nach dem absoluten Wert sortiert sind, sodass i = 1 das Residuum mit dem größten absoluten Wert darstellt und i = N das Residuum mit dem geringsten absoluten Wert darstellt.
Bei Verwendung der Kreuzvalidierung mit K Faltungen enthalten die Trainingsstatistiken die angepassten Werte aus dem endgültigen Baum für den vollständigen Datensatz. Die Teststatistiken verwenden angepasste Werte aus dem Validierungsprozess, der unterschiedliche Bäume für jede Faltung aufweisen kann.
Wird mit einem Testdatensatz validiert, verwenden die Teststatistiken nur die für den Testdatensatz angepassten Werte.
Begriff | Beschreibung |
---|---|
c | Zählung der größten Residuen für den prozentualen |
yi | i -ter beobachteter Ansprechwert |
mittlere Antwort | |
i -ter angepasste Antwort | |
N | Anzahl der Datensätze |