Begriff | Beschreibung |
---|---|
angepasster Wert | |
xk | k-ter Term. Jeder Term kann ein einzelner Prädiktor, ein Polynomialterm oder ein Wechselwirkungsterm sein. |
bk | Schätzwert des k-ten Regressionskoeffizienten |
Der Standardfehler des angepassten Werts in einem Regressionsmodell mit einem Prädiktor wird wie folgt ausgedrückt:
Der Standardfehler des angepassten Werts in einem Regressionsmodell mit mehreren Prädiktoren wird wie folgt ausgedrückt:
Fügen Sie für die gewichtete Regression die Gewichtsmatrix in die Gleichung ein:
Wenn die Daten über einen Testdatensatz oder eine K-Falten-Kreuzvalidierung verfügen, sind die Formeln identisch. Der Wert von s2 stammt aus den Trainingsdaten. Die Designmatrix und die Gewichtsmatrix stammen ebenfalls aus den Trainingsdaten.
Begriff | Beschreibung |
---|---|
s2 | mean square error |
n | number of observations |
x0 | new value of the predictor |
mean of the predictor | |
xi | i-ter predictor value |
x0 | vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term |
X =0 | transpose of the new vector of predictor values |
X | design matrix |
W | weight matrix |
Bei der gewichteten Regression enthält die Formel die Gewichtungen:
Dabei gilt Folgendes: tv ist das (1–α/2)-Quantil der t-Verteilung mit v Freiheitsgraden für ein beidseitiges Intervall. Für eine einseitige Grenze ist tv das (1–α)-Quantil der t-Verteilung mit v Freiheitsgraden.
Wenn Sie einen Testdatensatz oder eine Kreuzvalidierung mit K Faltungen verwenden, stammen die Freiheitsgrade und das mittlere Fehlerquadrat aus dem Trainingsdatensatz.
Begriff | Beschreibung |
---|---|
fitted value | |
quantile from the t distribution | |
degrees of freedom | |
mean square error | |
leverage for the i-te observation | |
wi | weight for the i-te observation |
Begriff | Beschreibung |
---|---|
yi | i-ter beobachteter Wert der Antwortvariablen |
i-ter angepasster Wert der Antwortvariablen |
Standardisierte Residuen werden auch als intern studentisierte Residuen bezeichnet.
Begriff | Beschreibung |
---|---|
ei | i-tes Residuum |
hi | i-tes Diagonalelement von X(X'X)–1X' |
s2 | mittleres Fehlerquadrat |
X | Designmatrix |
X' | transponierte Designmatrix |
Bei der gewichteten Regression enthält die Formel die Gewichtung:
Begriff | Beschreibung |
---|---|
ei | i -te residual in the validation data set |
hi | leverage for the i-te validation row |
s2 | mean square error for the training data set |
wi | weight for the i-te observation in the validation data set |
Diese werden auch als extern studentisierte Residuen bezeichnet. Die Formel lautet wie folgt:
Die Formel kann auch wie folgt ausgedrückt werden:
In dem Modell, mit dem die i-te Beobachtung geschätzt wird, wird die i-te Beobachtung aus dem Datensatz entfernt. Daher kann die i-te Beobachtung den Schätzwert nicht beeinflussen. Jedes entfernte Residuum hat eine Student-t-Verteilung mit Freiheitsgraden.
Begriff | Beschreibung |
---|---|
ei | i-tes Residuum |
s(i)2 | mittlerer quadrierter Fehler, der ohne die i-te Beobachtung berechnet wurde |
hi | i-tes Diagonalelement von X(X'X)–1X' |
n | Anzahl der Beobachtungen |
p | Anzahl der Terme, einschließlich der Konstanten |
SSE | Summe der Quadrate für Fehler |