Métodos y fórmulas para los ajustes y residuos en Analizar diseño factorial

En este tema

Ajuste
Residuos
Residuo estandarizado (Residuo est.)
Residuos eliminados (studentizados)
Residuos de parcela completa

Error estándar del valor ajustado (EE ajuste)
Error estándar de los valores ajustados (EE de ajuste) para un diseño de parcela dividida
Intervalo de confianza
Intervalo de predicción

Ajuste

Notación

Término	Description
	valor ajustado
x_k	k^ésimo término. Cada término puede ser un solo predictor, un término polinómico o un término de interacción.
k	estimación del k^ésimo coeficiente de regresión

Residuos

El residuo es la diferencia entre un valor observado y el valor ajustado correspondiente. Esta parte de la observación no es explicada por el modelo. El residuo de una observación es:

Notación

Término	Description
y_i	valor de la i^ésima respuesta observada
	i^ésimo valor ajustado para la respuesta

Residuo estandarizado (Residuo est.)

Los residuos estandarizados también se denominan residuos "studentizados internamente".

Fórmula

Notación

Término	Description
e_i	i ^ésimo residuo
h_i	i ^ésimo elemento diagonal de X(X'X)^–1X'
s²	cuadrado medio del error
X	matriz de diseño
X'	transpuesta de la matriz de diseño

Residuos eliminados (studentizados)

También conocidos como residuos studentizados externamente. La fórmula es:

Otra presentación de esta fórmula es:

El modelo que estima la i^ésima observación, omite la i^ésimaobservación del conjunto de datos. Por lo tanto, la i^ésima observación no puede influir en la estimación. Cada residuo eliminado tiene una distribución t de Student con grados de libertad.

Notación

Término	Description
e_i	i^ésimo residuo
s_(i)²	cuadrado medio del error calculado sin la i^ésima observación
h_i	i^ésimo elemento diagonal de X(X'X)^–1X'
n	número de observaciones
p	número de términos, incluyendo la constante
SSE	suma de los cuadrados para el error

Residuos de parcela completa

La parte de la observación debida a la variación completa (después de explicar los términos del modelo) en un diseño de parcela dividida.

Notación

Término	Description
	valor ajustado del modelo completo (incluye el término de error de parcela completa además de los términos fijos)
	valor ajustado utilizando solo los términos de efectos fijos, no el término de error de parcela completa

Error estándar del valor ajustado (EE ajuste)

El error estándar del valor ajustado en un modelo de regresión con un predictor es:

El error estándar del valor ajustado en un modelo de regresión con más de un predictor es:

Para la regresión ponderada, incluya la matriz de peso en la ecuación:

Cuando los datos tienen un conjunto de datos de prueba o una validación cruzada k-fold, las fórmulas son las mismas. El valor de s² es de los datos de entrenamiento. La matriz de diseño y la matriz de peso también provienen de los datos de entrenamiento.

Notación

Término	Description
s²	mean square error
n	number of observations
x₀	new value of the predictor
	mean of the predictor
x_i	i^-ésimo predictor value
x₀	vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'₀	transpose of the new vector of predictor values
X	design matrix
W	weight matrix

Error estándar de los valores ajustados (EE de ajuste) para un diseño de parcela dividida

Los errores estándar de los coeficientes son las raíces cuadradas de los elementos diagonales de la matriz de covarianzas:

El error estándar del valor ajustado en un punto dado (utilizado para intervalos de confianza) es:

El error estándar que se utiliza en los intervalos de predicción es:

Notación

Término	Description
	componente de varianza de parcela sub-dividida, calculado como MSE(PD)
X	matriz de diseño n × p para los efectos de factores, covariables, bloques y el término de error de parcela completa
	el componente de varianza de parcela completa, que en un diseño balanceado tiene esta fórmula:
m	el número de parcelas sub-divididas dentro de una parcela completa
Z	matriz de indicadores n × w de parcelas completas (todos los 1 y 0)
n	número de filas de datos
p	número de coeficientes
w	número de parcelas completas
x	vector de filas de niveles predictores
	matriz de covarianzas de β
β	vector de coeficientes

Intervalo de confianza

El rango en el que se espera que se encuentre la respuesta media estimada para un conjunto dado de valores de predictor.

Fórmula

Notación

Término	Description

	valor de respuesta ajustado para un conjunto dado de valores de predictor
α	tasa de error de tipo I
n	número de observaciones
p	número de parámetros del modelo
S ²(b)	matriz de varianzas-covarianzas de los coeficientes
s ²	cuadrado medio del error
X	matriz de diseño
X₀	vector de valores dados de predictor con 1 columna y p filas
X'₀	transposición del nuevo vector de valores de predictor con 1 fila y p columnas

Intervalo de predicción

El intervalo de predicción es el rango en el que se espera que se encuentre la respuesta ajustada para una nueva observación.

Fórmula

Notación

Término	Description
s(Pred)
	valor de respuesta ajustado para un conjunto dado de valores predictores
α	nivel de significancia
n	número de observaciones
p	número de parámetros del modelo
s ²	cuadrado medio del error
X	matriz de predictores
X₀	vector de valores dados de predictor con 1 columna y p filas
X'₀	transposición del nuevo vector de valores de predictor con 1 fila y p columnas