Métodos para Ajustar modelo de regresióny Regresión lineal

Seleccione el método o la fórmula de su preferencia.

En este tema

Regresión ponderada
Transformación de Box-Cox
Ecuación de regresión
Matriz de diseño
Inversa de x'x
Cómo elimina Minitab los predictores muy correlacionados de la ecuación de regresión en Ajustar modelo de regresión

Regresión ponderada

La regresión de mínimos cuadrados ponderados es un método para tratar las observaciones que tienen varianzas no constantes. Si las varianzas no son constantes, a las observaciones con:

a las grandes varianzas se les debe ofrecer ponderaciones relativamente pequeñas
a las pequeñas varianzas se les debe ofrecer ponderaciones relativamente grandes

La elección de ponderaciones generalmente es la inversa de la varianza de error puro en la respuesta.

La fórmula de los coeficientes estimados es como sigue:

Esto equivale a minimizar el error de SC ponderado.

Notación

Término	Description
X	matriz de diseño
X'	transpuesta de la matriz de diseño
W	una matriz n x n con las ponderaciones en la diagonal
Y	vector de valores de respuesta
n	número de observaciones
w_i	ponderación de la i^ésima observación
y_i	valor de respuesta de la i^ésima observación
	valor ajustado de la i^ésima observación

Transformación de Box-Cox

La transformación de Box Cox selecciona los valores de lambda, como se muestra a continuación, que minimizan la suma de los cuadrados de los residuos. La transformación resultante es Y ^λ cuando λ ≠ 0 y ln(Y) cuando λ = 0. Cuando λ < 0, Minitab también multiplica la respuesta transformada por −1 para mantener el orden de la respuesta no transformada.

Minitab busca un valor óptimo entre −2 y 2. Los valores que estén fuera de este intervalo podrían no producir un mejor ajuste.

Las siguientes son algunas transformaciones comunes donde Y′ es la transformación de los datos Y:

Valor de lambda (λ)	Transformación
λ = 2	Y′ = Y ²
λ = 0.5	Y′ =
λ = 0	Y′ = ln(Y )
λ = −0.5
λ = −1	Y′ = −1 / Y

Ecuación de regresión

Para un modelo con múltiples predictores, la ecuación es:

y = β₀ + β₁x₁ + ... + β_kx_k + ε

La ecuación ajustada es:

En la regresión lineal simple, que incluye solo un predictor, el modelo es:

y=ß₀+ ß₁x₁+ε

Usando estimaciones de regresión b₀ para ß₀y b₁ para ß₁, la ecuación ajustada es:

Ecuaciones con una variable categórica

Cuando se incluye una variable categórica en un modelo de regresión, hay 2 opciones para mostrar la ecuación de regresión:

Ecuación separada de cada conjunto de niveles predictores categóricos
Una sola ecuación

Estas dos opciones son equivalentes. Por ejemplo, supongamos que los datos tienen las siguientes variables:

C1: La variable respuesta
C2: Un predictor continuo
C3: Una variable predictora categórica con los niveles Rojo y Azul

Las ecuaciones separadas son las siguientes:

Azul: C1 = 0,184 + 0,1964*C2
Rojo: C1 = 0,011 + 0,1964*C2

Una sola ecuación utiliza una variable indicadora para representar la variable categórica.

C1 = 0,184 + 0,1964*C2 + 0,0*C3_Azul- 0,173*C3_Rojo

En la ecuación única, C3_Azul es igual a 1 si la observación es azul, y 0 en caso contrario. C3_Rojo es igual a 1 si la observación es roja, y 0 en caso contrario. Para cada grupo, sustituyamos la variable indicadora para verificar que la ecuación individual es la misma que las dos ecuaciones separadas.

Observación azul (C3_Azul = 1, C3_Rojo = 0): C1 = 0,184 + 0,1964*C2 + 0,0*1 - 0,173*0 = 0,184 + 0,1964*C2
Observación roja (C3_Azul = 0, C3_Rojo = 1: C1 = 0,084 + 0,1964*C2 + 0,0*0 - 0,173*1 = 0,011 + 0,1964*C2

Notación

Término	Description
y	Respuesta
x_k	^Ok-ésimo trimestre. Cada término puede ser un solo predictor, un término polinómico o un término de interacción.
ß_k	k^ésimo coeficiente de regresión poblacional
ε	término de error que sigue una distribución normal con una media de 0
b_k	Estimación del coeficiente de regresión poblacional k^ésimo
	respuesta ajustada

Matriz de diseño

La matriz de diseño contiene los predictores en una matriz (X) con n filas, donde n es el número de observaciones. Hay una columna para cada coeficiente del modelo.

Los predictores categóricos se codifican utilizando la codificación 1, 0 ó -1, 0, 1. X no incluye una columna para el nivel de referencia del factor.

Para calcular las columnas de un término de interacción, multiplique todos los valores correspondientes de los predictores incluidos en la interacción. Por ejemplo, supongamos que la primera observación tiene un valor de 4 para el predictor A y un valor de 2 para el predictor B. En la matriz de diseño, la interacción entre A y B se representa como 8 (4 x 2).

Inversa de x'x

Una matriz p x p, donde p es el número de coeficientes del modelo. Al multiplicar la inversa de x'x por el MSE, se obtiene la matriz de varianzas-covarianzas de los coeficientes. Minitab también utiliza la inversa de x'x para calcular los coeficientes de regresión y la matriz de sombrero.

Cómo elimina Minitab los predictores muy correlacionados de la ecuación de regresión en Ajustar modelo de regresión

Sea r_ij el elemento de la matriz con barrido actual asociada con X_i y X_j.

Las variables se ingresan o se eliminan una a la vez. X_k es elegible para ingreso si es una variable independiente que no se encuentra actualmente en el modelo con r_kk ≥ 1 (tolerancia con un valor predeterminado de 0.0001) y también para cada variable X_j que se encuentra actualmente en el modelo,

Para eliminar los predictores muy correlacionados de una ecuación de regresión, Minitab realiza los siguientes pasos:

Minitab aplica el método SWEEP (barrido) a la matriz de correlación, R, tratando a X₁ … X_p como si fueran variables aleatorias.
Para cualquier predictor continuo, Minitab compara el elemento r_kk con la tolerancia; r_kk ≥ tolerancia, donde k = 1 hasta p.
Para cada variable X_j actualmente en el modelo, Minitab verifica que (r_jj – r_jk * (r_kj / r_kk)) * tolerancia ≤ 1.
Nota
Donde r_kk, r_jk, r_jj son los elementos diagonales y fuera de la diagonal correspondientes para la variable X_j y X_k después de las operaciones SWEEP del paso k.
De lo contrario, el predictor no pasa la prueba y es eliminado del modelo.
Nota
El valor de tolerancia predeterminado es 8.8e–12.

Nota

Usted puede usar el subcomando TOLERANCE con el comando de sesión REGRESS para hacer que Minitab mantenga en el modelo un predictor que esté muy correlacionado con otro predictor. Sin embargo, bajar la tolerancia podría ser peligroso debido a la posibilidad de que se produzcan resultados numéricamente inexactos.