La Y pronosticada o es el valor de respuesta medio para los valores predictores dados utilizando la ecuación de regresión estimada.
Término | Description |
---|---|
\i | Indica que la observación i se excluyó del cálculo del modelo |
b0\i | la intersección del modelo que no incluye la observación i |
X | los valores predictores |
B(\i)(j, k) | los coeficientes del modelo que no incluye la observación i |
Término | Description |
---|---|
yi | valor de la iésima respuesta observada |
iésimo valor ajustado para la respuesta |
Los residuos con validación cruzada miden la capacidad predictiva del modelo y se utilizan para calcular el estadístico PRESS. Los residuos con validación cruzada en la regresión PLS y la regresión de mínimos cuadrados son conceptualmente similares, pero se calculan de manera diferente.
En PLS, los residuos con validación cruzada son las diferencias entre las respuestas reales y los valores ajustados con validación cruzada.
El valor del residuo con validación cruzada varía según la cantidad de observaciones que se omiten cada vez que se vuelve a calcular el modelo durante la validación cruzada.
En la regresión de mínimos cuadrados, los residuos con validación cruzada se calculan directamente a partir de los residuos ordinarios.
Término | Description |
---|---|
(i) | observación omitida del cálculo del modelo |
yi | valor de respuesta |
valor ajustado con validación cruzada |
Los residuos estandarizados también se denominan residuos "studentizados internamente".
Término | Description |
---|---|
ei | i ésimo residuo |
hi | i ésimo elemento diagonal de X(X'X)–1X' |
s2 | cuadrado medio del error |
X | matriz de diseño |
X' | transpuesta de la matriz de diseño |
El error estándar del valor ajustado en un modelo de regresión con un predictor es:
El error estándar del valor ajustado en un modelo de regresión con más de un predictor es:
Para la regresión ponderada, incluya la matriz de peso en la ecuación:
Cuando los datos tienen un conjunto de datos de prueba o una validación cruzada k-fold, las fórmulas son las mismas. El valor de s2 es de los datos de entrenamiento. La matriz de diseño y la matriz de peso también provienen de los datos de entrenamiento.
Término | Description |
---|---|
s2 | mean square error |
n | number of observations |
x0 | new value of the predictor |
mean of the predictor | |
xi | i-ésimo predictor value |
x0 | vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term |
x'0 | transpose of the new vector of predictor values |
X | design matrix |
W | weight matrix |
El intervalo de confianza es el rango en el que se espera que se encuentre la respuesta media estimada para un conjunto dado de valores predictores. El intervalo es definido por los límites inferior y superior, que Minitab calcula a partir del nivel de confianza y el error estándar de los ajustes.
Término | Description |
---|---|
α | valor alfa |
n | número de observaciones |
p | número de predictores |
s2 | cuadrado medio del error |
S2(b) | matriz de varianzas-covarianzas de los coeficientes |
El intervalo de predicción es el rango en el que se espera que se encuentre la respuesta ajustada para una nueva observación.
Término | Description |
---|---|
s(Pred) | |
valor de respuesta ajustado para un conjunto dado de valores predictores | |
α | nivel de significancia |
n | número de observaciones |
p | número de parámetros del modelo |
s 2 | cuadrado medio del error |
X | matriz de predictores |
X0 | vector de valores dados de predictor con 1 columna y p filas |
X'0 | transposición del nuevo vector de valores de predictor con 1 fila y p columnas |