Métodos y fórmulas para ajustes y residuos en Ajustar modelo de regresióny Regresión lineal

Seleccione el método o la fórmula de su preferencia.

En este tema

Ajuste
Error estándar del valor ajustado (EE ajuste)
Intervalo de confianza para un valor ajustado (IC)
Residuos
Residuo estandarizado (Residuo est.)
Residuo estandarizado (Resid est.) con validación
Residuos eliminados (studentizados)

Ajuste

Notación

Término	Description
	valor ajustado
x_k	k^ésimo término. Cada término puede ser un solo predictor, un término polinómico o un término de interacción.
k	estimación del k^ésimo coeficiente de regresión

Error estándar del valor ajustado (EE ajuste)

El error estándar del valor ajustado en un modelo de regresión con un predictor es:

El error estándar del valor ajustado en un modelo de regresión con más de un predictor es:

Para la regresión ponderada, incluya la matriz de peso en la ecuación:

Cuando los datos tienen un conjunto de datos de prueba o una validación cruzada k-fold, las fórmulas son las mismas. El valor de s² es de los datos de entrenamiento. La matriz de diseño y la matriz de peso también provienen de los datos de entrenamiento.

Notación

Término	Description
s²	mean square error
n	number of observations
x₀	new value of the predictor
	mean of the predictor
x_i	i^-ésimo predictor value
x₀	vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'₀	transpose of the new vector of predictor values
X	design matrix
W	weight matrix

Intervalo de confianza para un valor ajustado (IC)

Fórmula

Para la regresión, la siguiente fórmula proporciona los límites de confianza para un valor ajustado:

Para la regresión ponderada, la fórmula incluye las ponderaciones:

donde t_v es el cuantil de 1–α/2 de la distribución t con v grados de libertad para un intervalo bilateral. Para un límite unilateral, t_v es el cuantil de 1–α de la distribución t con v grados de libertad.

Cuando se utiliza un conjunto de datos de prueba o una validación cruzada de k pliegues, los grados de libertad y el cuadrado medio del error proceden del conjunto de datos de entrenamiento.

Cuando utilice una transformación Box-Cox, aplique la transformación inversa a la fórmula de intervalo de confianza para buscar los límites en las unidades de la respuesta original. Por ejemplo, si la transformación Box-Cox es el registro natural, la siguiente fórmula proporciona la transformación inversa:

Notación

Término	Description
	fitted value
	quantile from the t distribution
	degrees of freedom
	mean square error
	leverage for the i^-ésima observation
w_i	weight for the i^-ésima observation

Residuos

El residuo es la diferencia entre un valor observado y el valor ajustado correspondiente. Esta parte de la observación no es explicada por el modelo. El residuo de una observación es:

Notación

Término	Description
y_i	valor de la i^ésima respuesta observada
	i^ésimo valor ajustado para la respuesta

Residuo estandarizado (Residuo est.)

Los residuos estandarizados también se denominan residuos "studentizados internamente".

Fórmula

Notación

Término	Description
e_i	i ^ésimo residuo
h_i	i ^ésimo elemento diagonal de X(X'X)^–1X'
s²	cuadrado medio del error
X	matriz de diseño
X'	transpuesta de la matriz de diseño

Residuo estandarizado (Resid est.) con validación

Para los datos de validación, el denominador de la fórmula para el residuo estandarizado agrega el apalancamiento en lugar de restar el apalancamiento.

Fórmula

Para la regresión ponderada, la fórmula incluye la ponderación:

Notación

Término	Description
e_i	i^-ésima residual in the validation data set
h_i	leverage for the i^-ésima validation row
s²	mean square error for the training data set
w_i	weight for the i^-ésima observation in the validation data set

Residuos eliminados (studentizados)

También conocidos como residuos studentizados externamente. La fórmula es:

Otra presentación de esta fórmula es:

El modelo que estima la i^ésima observación, omite la i^ésimaobservación del conjunto de datos. Por lo tanto, la i^ésima observación no puede influir en la estimación. Cada residuo eliminado tiene una distribución t de Student con grados de libertad.

Notación

Término	Description
e_i	i^ésimo residuo
s_(i)²	cuadrado medio del error calculado sin la i^ésima observación
h_i	i^ésimo elemento diagonal de X(X'X)^–1X'
n	número de observaciones
p	número de términos, incluyendo la constante
SSE	suma de los cuadrados para el error