Métodos y fórmulas para el análisis de la varianza en Ajustar modelo de regresióny Regresión lineal

Seleccione el método o la fórmula de su preferencia.

Suma de los cuadrados (SC)

En términos de matriz, estas son las fórmulas para las diferentes sumas de cuadrados:

Minitab desglosa el componente SC Regresión o SC Tratamientos en la cantidad de variación explicada por cada término utilizando tanto la suma de cuadrados secuenciales como la suma de cuadrados ajustados.

Notación

TérminoDescription
bvector de coeficientes
Xmatriz de diseño
Yvector de valores de respuesta
nnúmero de observaciones
Jn entre n matriz de 1s

Suma secuencial de los cuadrados

Minitab desglosa el componente SC Regresión o Tratamientos de la varianza en las sumas secuenciales de los cuadrados para cada factor. Las sumas secuenciales de los cuadrados dependen del orden en que los factores o predictores se ingresan en el modelo. Las sumas secuenciales de cuadrados es la porción única de la SC Regresión explicada por un factor, dados los factores ingresados previamente.

Por ejemplo, si se tiene un modelo con tres factores o predictores, X1, X2 y X3, la suma secuencial de cuadrados para X2 muestra qué proporción de la variación restante puede explicar X2, dado que X1 ya se encuentra en el modelo. Para obtener una secuencia diferente de factores, repita el análisis e ingrese los factores en un orden diferente.

Grados de libertad (GL)

Los grados de libertad para cada componente del modelo son:

Fuentes de variación GL
Regresión p
Error n – p – 1
Total n – 1

Si los datos cumplen con ciertos criterios y el modelo incluye al menos un predictor continuo o más de un predictor categórico, Minitab utiliza algunos grados de libertad para la prueba de falta de ajuste. Los criterios son los siguientes:
  • Los datos contienen múltiples observaciones con los mismos valores predictores.
  • Los datos contienen los puntos correctos para estimar términos adicionales que no están en el modelo.

Notación

TérminoDescription
n número de observaciones
p número de coeficientes en el modelo, sin contar la constante

CM ajust – Regresión

La fórmula del cuadrado medio (CM) de la regresión es:

Notación

TérminoDescription
respuesta media
iésima respuesta ajustada
pnúmero de términos en el modelo

CM ajustado – Error

El cuadrado medio del error (también abreviado como CM error o MSE y conocido como s2) es la varianza alrededor de la línea de regresión ajustada. La fórmula es:

Notación

TérminoDescription
yiiésimo valor de respuesta observado
iésima respuesta ajustada
nnúmero de observaciones
pnúmero de coeficientes en el modelo, sin contar la constante

CM Ajust. – Total

La fórmula para el cuadrado medio (CM) total es:

Notación

TérminoDescription
respuesta media
yivalor de la iésima respuesta observada
nnúmero de observaciones

Valor F

Las fórmulas para el estadístico F son las siguientes:

F(Regresión)
F(Término)
F(Falta de ajuste)

Notación

TérminoDescription
CM RegresiónUna medida de la variación en la respuesta que explica el modelo actual.
CM ErrorUna medida de la variación que el modelo no explica.
CM TérminoUna medida de la cantidad de variación que un término explica después de justificar los otros términos incluidos en el modelo.
CM Falta de ajusteUna medida de la variación en la respuesta que podría modelarse al agregar más términos al modelo.
CM Error puroUna medida de la variación en los datos de respuesta replicados.

Valor p – Tabla Análisis de varianza

El valor p es una probabilidad que se calcula a partir de una distribución F con los grados de libertad (GL) que se indican a continuación:

GL del numerador
suma de los grados de libertad para el término o los términos en la prueba
GL del denominador
grados de libertad para el error

Fórmula

1 − P(Ffj)

Notación

TérminoDescription
P(Ff)función de distribución acumulada para la distribución F
festadístico F para la prueba

Prueba de falta de ajuste de error puro

Para calcular la prueba de falta de ajuste de error puro, Minitab calcula:
  1. La suma de las desviaciones al cuadrado de la respuesta con respecto a la media en cada conjunto de réplicas y las suma juntas para crear la suma de los cuadrados del error puro (SC EP).
  2. El cuadrado medio del error puro

    donde n = número de observaciones y m = número de distintas combinaciones del nivel x

  3. La suma de los cuadrados de la falta de ajuste
  4. El cuadrado medio de la falta de ajuste
  5. Los estadísticos de prueba

Los valores F y los valores p pequeños sugieren que el modelo es inadecuado.

Valor p – Prueba de falta de ajuste

Este valor p corresponde a la prueba de la hipótesis nula de que los coeficientes son iguales a 0 para los términos que se pueden calcular a partir de estos datos que no están incluidos en el modelo. El valor p es la probabilidad de una distribución F con los grados de libertad (GL) que se indican a continuación:
GL del numerador
grados de libertad para la falta de ajuste
GL del denominador
grados de libertad para el error puro

Fórmula

1 − P(Ffj)

Notación

TérminoDescription
P(Ffj)función de distribución acumulada para la distribución F
fjestadístico F para la prueba