Métodos y fórmulas para el análisis de varianza en Analizar diseño de mezcla

Seleccione el método o la fórmula de su preferencia.

Suma de los cuadrados (SC)

En términos de matriz, estas son las fórmulas para las diferentes sumas de cuadrados:

Minitab desglosa el componente SC Regresión o SC Tratamientos en la cantidad de variación explicada por cada término utilizando tanto la suma de cuadrados secuenciales como la suma de cuadrados ajustados.

Notación

TérminoDescription
bvector de coeficientes
Xmatriz de diseño
Yvector de valores de respuesta
nnúmero de observaciones
Jn entre n matriz de 1s

Suma secuencial de los cuadrados

Minitab desglosa el componente SC Regresión o Tratamientos de la varianza en las sumas secuenciales de los cuadrados para cada factor. Las sumas secuenciales de los cuadrados dependen del orden en que los factores o predictores se ingresan en el modelo. Las sumas secuenciales de cuadrados es la porción única de la SC Regresión explicada por un factor, dados los factores ingresados previamente.

Por ejemplo, si se tiene un modelo con tres factores o predictores, X1, X2 y X3, la suma secuencial de cuadrados para X2 muestra qué proporción de la variación restante puede explicar X2, dado que X1 ya se encuentra en el modelo. Para obtener una secuencia diferente de factores, repita el análisis e ingrese los factores en un orden diferente.

Suma ajustada de los cuadrados

Las sumas ajustadas de los cuadrados no dependen del orden en que los términos se ingresan en el modelo. La suma ajustada de los cuadrados es la cantidad de variación explicada por un término, dados todos los otros términos estén incluidos en el modelo, independientemente del orden en que se ingresen los términos en el modelo.

Por ejemplo, si usted tiene un modelo con tres factores, X1, X2 y X3, la suma ajustada de los cuadrados para X2 muestra la proporción de la variación restante que es explicada por el término para X2, dado que los términos para X1 y X3 también se encuentren en el modelo.

Los cálculos de las sumas ajustadas de los cuadrados para tres factores son:

  • SSR(X3 | X1, X2) = SSE (X1, X2) - SSE (X1, X2, X3) o
  • SSR(X3 | X1, X2) = SSR (X1, X2, X3) - SSR (X1, X2)

donde SSR(X3 | X1, X2) es la suma ajustada de los cuadrados para X3, dado que X1 y X2 estén en el modelo.

  • SSR(X2, X3 | X1) = SSE (X1) - SSE (X1, X2, X3) o
  • SSR(X2, X3 | X1) = SSR (X1, X2, X3) - SSR (X1)

donde SSR(X2, X3 | X1) es la suma ajustada de los cuadrados para X2 y X3, dado que X1 esté en el modelo.

Usted puede ampliar estas fórmulas si tienen más de 3 factores en el modelo1.

  1. J. Neter, W. Wasserman y M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

Grados de libertad (GL)

Indica el número de informaciones independientes que incluyen los datos de respuesta necesarios para calcular la suma de los cuadrados. Los grados de libertad para cada componente del modelo son:

GL Regresión = p - 1
GL Error = n - p
Total = n - 1

donde n = número de observaciones y p = número de términos en el modelo.

CM ajust – Regresión

La fórmula del cuadrado medio (CM) de la regresión es:

Notación

TérminoDescription
respuesta media
iésima respuesta ajustada
pnúmero de términos en el modelo

CM Ajust – Error

El cuadrado medio del error (también abreviado como CM error o MSE y denotado como s2) es la varianza alrededor de la línea de regresión ajustada. La fórmula es:

Notación

TérminoDescription
yivalor de la iésima respuesta observada
iésima respuesta ajustada
nnúmero de observaciones
pnúmero de coeficientes en el modelo

F

Si todos los factores en el modelo son fijos, entonces el cálculo del estadístico F depende de lo que se trata la prueba de hipótesis, como sigue:

F(Término)
F(Falta de ajuste)

Si hay factores aleatorios en el modelo, F se construye utilizando la información del cuadrado medio esperado para cada término. Para obtener más información, consulte a Neter et al.1.

Notación

TérminoDescription
Término de CM Ajust.Una medida de la cantidad de variación que explica un término después de representar los demás términos en el modelo.
Error CMUna medida de la variación que el modelo no explica.
Falta de ajuste de CMUna medida de la variación en la respuesta que pudiera modelarse agregando más términos al modelo.
Error puro CMUna medida de la variación en los datos de respuesta replicada.
  1. J. Neter, W. Wasserman y M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

Valor p – Tabla Análisis de varianza

El valor p es una probabilidad que se calcula a partir de una distribución F con los grados de libertad (GL) que se indican a continuación:

GL del numerador
suma de los grados de libertad para el término o los términos en la prueba
GL del denominador
grados de libertad para el error

Fórmula

1 − P(Ffj)

Notación

TérminoDescription
P(Ff)función de distribución acumulada para la distribución F
festadístico F para la prueba