Métodos y fórmulas para ajustes y residuos en Regresión de cuadrados mínimos parciales

Seleccione el método o la fórmula de su preferencia.

En este tema

Valores ajustados
Valores ajustados con validación cruzada
Residuos
Residuos con validación cruzada
Residuo estandarizado (Residuo est.)
Error estándar del valor ajustado (EE ajuste)
Intervalo de confianza
Intervalo de predicción

Valores ajustados

La Y pronosticada o es el valor de respuesta medio para los valores predictores dados utilizando la ecuación de regresión estimada.

Valores ajustados con validación cruzada

Los valores ajustados con validación cruzada indican qué tan bien el modelo predice los datos. Estos valores son similares a los valores ajustados ordinarios, que indican qué tan bien se ajusta el modelo a los datos. Para obtener el valor ajustado con validación cruzada para una observación, esta se debe retirar de los datos utilizados para calcular el modelo y luego se calcula el ajuste con el vector de coeficiente que es independiente de la observación. La fórmula para los valores ajustados con validación cruzada es la siguiente:

Notación

Término	Description
\i	Indica que la observación i se excluyó del cálculo del modelo
b_0\i	la intersección del modelo que no incluye la observación i
X	los valores predictores
B_{(\i)(j, k)}	los coeficientes del modelo que no incluye la observación i

Residuos

El residuo es la diferencia entre un valor observado y el valor ajustado correspondiente. Esta parte de la observación no es explicada por el modelo. El residuo de una observación es:

Notación

Término	Description
y_i	valor de la i^ésima respuesta observada
	i^ésimo valor ajustado para la respuesta

Residuos con validación cruzada

Los residuos con validación cruzada miden la capacidad predictiva del modelo y se utilizan para calcular el estadístico PRESS. Los residuos con validación cruzada en la regresión PLS y la regresión de mínimos cuadrados son conceptualmente similares, pero se calculan de manera diferente.

Fórmula

En PLS, los residuos con validación cruzada son las diferencias entre las respuestas reales y los valores ajustados con validación cruzada.

El valor del residuo con validación cruzada varía según la cantidad de observaciones que se omiten cada vez que se vuelve a calcular el modelo durante la validación cruzada.

En la regresión de mínimos cuadrados, los residuos con validación cruzada se calculan directamente a partir de los residuos ordinarios.

Notación

Término	Description
(i)	observación omitida del cálculo del modelo
y_i	valor de respuesta
	valor ajustado con validación cruzada

Residuo estandarizado (Residuo est.)

Los residuos estandarizados también se denominan residuos "studentizados internamente".

Fórmula

Notación

Término	Description
e_i	i ^ésimo residuo
h_i	i ^ésimo elemento diagonal de X(X'X)^–1X'
s²	cuadrado medio del error
X	matriz de diseño
X'	transpuesta de la matriz de diseño

Error estándar del valor ajustado (EE ajuste)

El error estándar del valor ajustado en un modelo de regresión con un predictor es:

El error estándar del valor ajustado en un modelo de regresión con más de un predictor es:

Para la regresión ponderada, incluya la matriz de peso en la ecuación:

Cuando los datos tienen un conjunto de datos de prueba o una validación cruzada k-fold, las fórmulas son las mismas. El valor de s² es de los datos de entrenamiento. La matriz de diseño y la matriz de peso también provienen de los datos de entrenamiento.

Notación

Término	Description
s²	mean square error
n	number of observations
x₀	new value of the predictor
	mean of the predictor
x_i	i^-ésimo predictor value
x₀	vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'₀	transpose of the new vector of predictor values
X	design matrix
W	weight matrix

Intervalo de confianza

El intervalo de confianza es el rango en el que se espera que se encuentre la respuesta media estimada para un conjunto dado de valores predictores. El intervalo es definido por los límites inferior y superior, que Minitab calcula a partir del nivel de confianza y el error estándar de los ajustes.

Fórmula

Notación

Término	Description
α	valor alfa
n	número de observaciones
p	número de predictores

s²	cuadrado medio del error
S²(b)	matriz de varianzas-covarianzas de los coeficientes

Intervalo de predicción

El intervalo de predicción es el rango en el que se espera que se encuentre la respuesta ajustada para una nueva observación.

Fórmula

Notación

Término	Description
s(Pred)
	valor de respuesta ajustado para un conjunto dado de valores predictores
α	nivel de significancia
n	número de observaciones
p	número de parámetros del modelo
s ²	cuadrado medio del error
X	matriz de predictores
X₀	vector de valores dados de predictor con 1 columna y p filas
X'₀	transposición del nuevo vector de valores de predictor con 1 fila y p columnas