Métodos y fórmulas para el análisis de varianza en Analizar variabilidad

En este tema

Suma de los cuadrados (SC)
Suma secuencial de los cuadrados
Suma ajustada de los cuadrados
Grados de libertad (GL)
CM Ajust. – Término
F
Valor p – Tabla Análisis de varianza
Prueba de falta de ajuste de error puro
Valor p – Prueba de falta de ajuste

Suma de los cuadrados (SC)

La suma de distancias cuadradas. Las fórmulas presentadas son para un modelo factorial completo de dos factores con factores A y B. Estas fórmulas se pueden extender a modelos con más de dos factores. Para obtener más información, véase Montgomery¹.

La SC total es la variación total en el modelo. SC (A) y SC (B) son la suma de las desviaciones cuadradas de las medias de niveles de factores estimadas alrededor de la media general. El error de SC es la suma de los residuos cuadráticos. Esto se conoce también como un error en los tratamientos. Los cálculos son:

Si el modelo incluye réplicas, SC de Error puro es:

Para casos diferentes del modelo factorial completo de dos factores, usted puede tener otras sumas de cuadrados. Si ajusta un modelo reducido, Falta de ajuste de SC es:

Si el modelo incluye los puntos centrales, Curvatura de SC es:

En diseños de parcela dividida, las sumas de cuadrados para variación de parcela completa y de error para parcela subdividida son:

D.C. Montgomery (1991). Design and Analysis of Experiments, Third Edition, John Wiley & Sons.

Notación

Término	Description
a	número de niveles en el factor A
b	número de niveles en el factor B
n	número total de réplicas
	media del i^ésimo nivel del factor A
	media general de todas las observaciones
	media del j^ésimo nivel del factor B
	observación en el i^ésimo nivel del factor A, j^ésimo nivel del factor B y la k^ésima réplica
	media del i^ésimo nivel del factor A y el j^ésimo nivel del factor B
	respuesta media de puntos centrales
	respuesta media para puntos factoriales
n_F	número de puntos factoriales

Suma secuencial de los cuadrados

Minitab desglosa el componente SC Regresión o Tratamientos de la varianza en las sumas secuenciales de los cuadrados para cada factor. Las sumas secuenciales de los cuadrados dependen del orden en que los factores o predictores se ingresan en el modelo. Las sumas secuenciales de cuadrados es la porción única de la SC Regresión explicada por un factor, dados los factores ingresados previamente.

Por ejemplo, si se tiene un modelo con tres factores o predictores, X1, X2 y X3, la suma secuencial de cuadrados para X2 muestra qué proporción de la variación restante puede explicar X2, dado que X1 ya se encuentra en el modelo. Para obtener una secuencia diferente de factores, repita el análisis e ingrese los factores en un orden diferente.

Suma ajustada de los cuadrados

Las sumas ajustadas de los cuadrados no dependen del orden en que los términos se ingresan en el modelo. La suma ajustada de los cuadrados es la cantidad de variación explicada por un término, dados todos los otros términos estén incluidos en el modelo, independientemente del orden en que se ingresen los términos en el modelo.

Por ejemplo, si usted tiene un modelo con tres factores, X1, X2 y X3, la suma ajustada de los cuadrados para X2 muestra la proporción de la variación restante que es explicada por el término para X2, dado que los términos para X1 y X3 también se encuentren en el modelo.

Los cálculos de las sumas ajustadas de los cuadrados para tres factores son:

SSR(X3 | X1, X2) = SSE (X1, X2) - SSE (X1, X2, X3) o
SSR(X3 | X1, X2) = SSR (X1, X2, X3) - SSR (X1, X2)

donde SSR(X3 | X1, X2) es la suma ajustada de los cuadrados para X3, dado que X1 y X2 estén en el modelo.

SSR(X2, X3 | X1) = SSE (X1) - SSE (X1, X2, X3) o
SSR(X2, X3 | X1) = SSR (X1, X2, X3) - SSR (X1)

donde SSR(X2, X3 | X1) es la suma ajustada de los cuadrados para X2 y X3, dado que X1 esté en el modelo.

Usted puede ampliar estas fórmulas si tienen más de 3 factores en el modelo¹.

J. Neter, W. Wasserman y M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

Grados de libertad (GL)

Para un diseño factorial completo con factores A y B y una variable de bloqueo, el número de grados de libertad asociado con cada suma de cuadrados es:

Para interacciones entre factores, multiplique los grados de libertad de los términos en los factores. Por ejemplo, si los factores son A y B, entonces la interacción AB tiene estos grados de libertad:

Para hallar los grados de libertad de un tipo de término, sume los grados de libertad de los términos. Por ejemplo, si los factores son A y B, entonces los efectos principales en el modelo tienen esta cantidad de grados de libertad:

Para diseños de 2 niveles con puntos centrales, el número de grados de libertad para la curvatura es 1.

Notación

Término	Description
a	número de niveles en el factor A
b	número de niveles en el factor B
c	número de bloques
n	número total de observaciones
n_i	número de observaciones para la i^ésima combinación de nivel de factores
m	número de combinaciones de nivel de factores
p	número de coeficientes

CM Ajust. – Término

El cálculo de Cuadrado medio (CM) para el término del modelo es:

F

Una prueba para determinar si los efectos principales y de interacción son significativos. La fórmula para los términos del modelo es:

Los grados de libertad para la prueba son:

Numerador = grados de libertad para el término
Denominador = grados de libertad para el error

Valores más grandes de F apoyan rechazar la hipótesis nula de que no hay un efecto significativo.

Para diseños balanceados de parcelas divididas, el estadístico F para factores difíciles de cambiar utiliza los CM para el error de parcela completa en el denominador. Para otros diseños de parcelas divididas, Minitab usa una combinación lineal del Error de PC y el Error de PD para construir un denominador que se base en los cuadrados medios esperados.

Valor p – Tabla Análisis de varianza

El valor p es una probabilidad que se calcula a partir de una distribución F con los grados de libertad (GL) que se indican a continuación:

GL del numerador: suma de los grados de libertad para el término o los términos en la prueba
GL del denominador: grados de libertad para el error

Fórmula

1 − P(F ≤ f_j)

Notación

Término	Description
P(F ≤ f)	función de distribución acumulada para la distribución F
f	estadístico F para la prueba

Prueba de falta de ajuste de error puro

Para calcular la prueba de falta de ajuste de error puro, Minitab calcula:

La suma de las desviaciones al cuadrado de la respuesta con respecto a la media en cada conjunto de réplicas y las suma juntas para crear la suma de los cuadrados del error puro (SC EP).
El cuadrado medio del error puro

donde n = número de observaciones y m = número de distintas combinaciones del nivel x
La suma de los cuadrados de la falta de ajuste
El cuadrado medio de la falta de ajuste
Los estadísticos de prueba

Los valores F y los valores p pequeños sugieren que el modelo es inadecuado.

Valor p – Prueba de falta de ajuste

Este valor p corresponde a la prueba de la hipótesis nula de que los coeficientes son iguales a 0 para los términos que se pueden calcular a partir de estos datos que no están incluidos en el modelo. El valor p es la probabilidad de una distribución F con los grados de libertad (GL) que se indican a continuación:

GL del numerador: grados de libertad para la falta de ajuste
GL del denominador: grados de libertad para el error puro

Fórmula

1 − P(F ≤ f_j)

Notación

Término	Description
P(F ≤ f_j)	función de distribución acumulada para la distribución F
f_j	estadístico F para la prueba