Das prognostizierte y oder ist der Mittelwert der Antwortvariablen für die gegebenen Prädiktorwerte unter Verwendung der geschätzten Regressionsgleichung.
Begriff | Beschreibung |
---|---|
\i | Gibt an, dass Beobachtung i aus der Modellberechnung entfernt wurde |
b0\i | Schnittpunkt mit der y-Achse für das Modell, das Beobachtung i nicht enthält |
X | Prädiktorwerte |
B(\i)(j, k) | Koeffizienten für das Modell, das Beobachtung i nicht enthält |
Begriff | Beschreibung |
---|---|
yi | i-ter beobachteter Wert der Antwortvariablen |
i-ter angepasster Wert der Antwortvariablen |
Mit Hilfe von kreuzvalidierten Residuen wird die Prognosefähigkeit des Modells gemessen, und es wird die PRESS-Statistik berechnet. Kreuzvalidierte Residuen in der PLS-Regression und der Regression der kleinsten Quadrate ähneln sich im Konzept, werden aber unterschiedlich berechnet.
In PLS sind die kreuzvalidierten Residuen die Differenzen zwischen den tatsächlichen Werten der Antwortvariablen und den kreuzvalidierten angepassten Werten.
Der Wert des kreuzvalidierten Residuums variiert je nach der Anzahl der entfernten Beobachtungen bei jeder Neuberechnung des Modells während der Kreuzvalidierung.
Bei der Regression der kleinsten Quadrate werden die kreuzvalidierten Residuen direkt aus den einfachen Residuen berechnet.
Begriff | Beschreibung |
---|---|
(i) | aus der Modellberechnung entfernte Beobachtung |
yi | Wert der Antwortvariablen |
kreuzvalidierter angepasster Wert |
Standardisierte Residuen werden auch als intern studentisierte Residuen bezeichnet.
Begriff | Beschreibung |
---|---|
ei | i-tes Residuum |
hi | i-tes Diagonalelement von X(X'X)–1X' |
s2 | mittleres Fehlerquadrat |
X | Designmatrix |
X' | transponierte Designmatrix |
Der Standardfehler des angepassten Werts in einem Regressionsmodell mit einem Prädiktor wird wie folgt ausgedrückt:
Der Standardfehler des angepassten Werts in einem Regressionsmodell mit mehreren Prädiktoren wird wie folgt ausgedrückt:
Fügen Sie für die gewichtete Regression die Gewichtsmatrix in die Gleichung ein:
Wenn die Daten über einen Testdatensatz oder eine K-Falten-Kreuzvalidierung verfügen, sind die Formeln identisch. Der Wert von s2 stammt aus den Trainingsdaten. Die Designmatrix und die Gewichtsmatrix stammen ebenfalls aus den Trainingsdaten.
Begriff | Beschreibung |
---|---|
s2 | mean square error |
n | number of observations |
x0 | new value of the predictor |
mean of the predictor | |
xi | i-ter predictor value |
x0 | vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term |
X =0 | transpose of the new vector of predictor values |
X | design matrix |
W | weight matrix |
Das Konfidenzintervall ist der Bereich, in dem der geschätzte Mittelwert der Antwortvariablen bei einer gegebenen Gruppe von Prädiktorwerten erwartet wird. Das Intervall wird durch eine untere und eine obere Grenze definiert, die Minitab aus dem Konfidenzniveau und dem Standardfehler der Anpassungen berechnet.
Begriff | Beschreibung |
---|---|
α | Alpha-Wert |
n | Anzahl der Beobachtungen |
p | Anzahl der Prädiktoren |
s 2 | mittleres Fehlerquadrat |
S 2(b) | Varianz-Kovarianz-Matrix der Koeffizienten |
Das Prognoseintervall ist der Bereich, in dem der angepasste Wert der Antwortvariablen für eine neue Beobachtung erwartet wird.
Begriff | Beschreibung |
---|---|
s(Prog) | |
angepasster Wert der Antwortvariablen für eine gegebene Gruppe von Prädiktorwerten | |
α | Signifikanzniveau |
n | Anzahl der Beobachtungen |
p | Anzahl der Modellparameter |
s 2 | mittleres Fehlerquadrat |
X | Prädiktormatrix |
X0 | Vektor der angegebenen Prädiktorwerte mit 1 Spalte und p Zeilen |
X'0 | Transponierung des neuen Vektors von Prädiktorwerten mit 1 Zeilen und p Spalten |