Métodos y fórmulas para el análisis de varianza en Analizar diseño de cribado definitivo

Suma ajustada de los cuadrados

Las sumas ajustadas de los cuadrados no dependen del orden en que los términos se ingresan en el modelo. La suma ajustada de los cuadrados es la cantidad de variación explicada por un término, dados todos los otros términos estén incluidos en el modelo, independientemente del orden en que se ingresen los términos en el modelo.

Por ejemplo, si usted tiene un modelo con tres factores, X1, X2 y X3, la suma ajustada de los cuadrados para X2 muestra la proporción de la variación restante que es explicada por el término para X2, dado que los términos para X1 y X3 también se encuentren en el modelo.

Los cálculos de las sumas ajustadas de los cuadrados para tres factores son:

  • SSR(X3 | X1, X2) = SSE (X1, X2) - SSE (X1, X2, X3) o
  • SSR(X3 | X1, X2) = SSR (X1, X2, X3) - SSR (X1, X2)

donde SSR(X3 | X1, X2) es la suma ajustada de los cuadrados para X3, dado que X1 y X2 estén en el modelo.

  • SSR(X2, X3 | X1) = SSE (X1) - SSE (X1, X2, X3) o
  • SSR(X2, X3 | X1) = SSR (X1, X2, X3) - SSR (X1)

donde SSR(X2, X3 | X1) es la suma ajustada de los cuadrados para X2 y X3, dado que X1 esté en el modelo.

Usted puede ampliar estas fórmulas si tienen más de 3 factores en el modelo1.

  1. J. Neter, W. Wasserman y M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

Suma de los cuadrados (SC)

En términos de matriz, estas son las fórmulas para las diferentes sumas de cuadrados:

Minitab desglosa el componente del modelo SC en la cantidad de variación explicada por cada término o conjunto de términos utilizando tanto la suma de cuadrados secuenciales como la suma de cuadrados ajustados.

Notación

TérminoDescription
bvector de coeficientes
Xmatriz de diseño
Yvector de valores de respuesta
n número de observaciones
Jn entre n matriz de 1s

Suma secuencial de los cuadrados

Minitab desglosa el componente del modelo de SC de la varianza en las sumas secuenciales de los cuadrados para cada término de factor o conjunto de términos de factor. Las sumas secuenciales de los cuadrados dependen del orden en que los factores o predictores se ingresan en el modelo. La suma secuencial de cuadrados es la porción única del modelo de SC que explica cada término, dado cualquier término que se haya ingresado previamente.

Por ejemplo, si usted tiene un modelo con tres factores, X1, X2 y X3, la suma secuencial de cuadrados de X2 muestra cuanto de la variación restante explica X2 , dado que X1 ya está en el modelo. Para obtener una secuencia diferente de términos, repita el análisis e ingrese los términos en un orden diferente.

Grados de libertad (GL)

Diferentes sumas de cuadrados tienen diferentes grados de libertad.

GL para un factor numérico = 1

GL para un factor categórico = b - 1

GL para un término cuadrático = 1

GL para bloques = c - 1

GL para error = n - p

GL para error puro =

GL para falta de ajuste = m − p

GL total = n − 1

Para interacciones entre factores, multiplique los grados de libertad de los términos en los factores. Por ejemplo, si los factores son A y B, entonces la interacción AB tiene estos grados de libertad:
Para hallar los grados de libertad de un tipo de término, sume los grados de libertad de los términos. Por ejemplo, si los factores son A y B, entonces los efectos principales en el modelo tienen esta cantidad de grados de libertad:
Nota

Los factores categóricos en los diseños cribados en Minitab tienen 2 niveles. De este modo, los grados de libertad para un factor categórico son 2 – 1 = 1. Por extensión, las interacciones entre los factores también tienen 1 grado de libertad.

Notación

TérminoDescription
bEl número de niveles en el factor
cEl número de bloques
nEl número total de observaciones
niEl número de observaciones para la iésima combinación de nivel de factores
mEl número de combinaciones de niveles de factores
pEl número de coeficientes

CM Ajust. – Modelo

Notación

TérminoDescription
La media de la variable de respuesta
El iésimo valor ajustado de la respuesta
pEl número de términos en el modelo, sin incluir el término constante

CM Ajust. – Término

El cálculo de Cuadrado medio (CM) para el término del modelo es:

CM ajustado – Error

El cuadrado medio del error (también abreviado como CM error o MSE y conocido como s2) es la varianza alrededor de la línea de regresión ajustada. La fórmula es:

Notación

TérminoDescription
yiiésimo valor de respuesta observado
iésima respuesta ajustada
nnúmero de observaciones
pnúmero de coeficientes en el modelo, sin contar la constante

F

El cálculo del estadístico F depende de la prueba de hipótesis, como se muestra a continuación:

F(Término)
F(Falta de ajuste)

Notación

TérminoDescription
Término de CM Ajust.Una medida de la cantidad de variación que explica un término después de representar los demás términos en el modelo.
Error CMUna medida de la variación que el modelo no explica.
Falta de ajuste de CMUna medida de la variación en la respuesta que pudiera modelarse agregando más términos al modelo.
Error puro CMUna medida de la variación en los datos de respuesta replicada.
  1. J. Neter, W. Wasserman y M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

Valor p – Tabla Análisis de varianza

El valor p es una probabilidad que se calcula a partir de una distribución F con los grados de libertad (GL) que se indican a continuación:

GL del numerador
suma de los grados de libertad para el término o los términos en la prueba
GL del denominador
grados de libertad para el error

Fórmula

1 − P(Ffj)

Notación

TérminoDescription
P(Ff)función de distribución acumulada para la distribución F
festadístico F para la prueba

Valor p – Prueba de falta de ajuste

Este valor p corresponde a la prueba de la hipótesis nula de que los coeficientes son iguales a 0 para los términos que se pueden calcular a partir de estos datos que no están incluidos en el modelo. El valor p es la probabilidad de una distribución F con los grados de libertad (GL) que se indican a continuación:
GL del numerador
grados de libertad para la falta de ajuste
GL del denominador
grados de libertad para el error puro

Fórmula

1 − P(Ffj)

Notación

TérminoDescription
P(Ffj)función de distribución acumulada para la distribución F
fjestadístico F para la prueba