Métodos y fórmulas para la ANOVA completamente anidado

Modelo ANOVA completamente anidado

El modelo ANOVA anidado para un diseño balanceado con dos factores aleatorios (A y B) es:

y_ijk = μ .. + α _i+ β _j(i)+ε_ijk

donde α _i, β _j(i) y ε _ijkson variables aleatorias normales independientes con expectativas 0 y varianzas σ²_α, σ²_β y σ², respectivamente.

Los parámetros se estiman mediante lo siguiente:

μ .. = y̅...

α _i = y_i..− y̅...

β _j(i) = y_ij.− y̅_i..

donde y̅... = media de todas las observaciones, y_i..= media de observaciones en el i^ésimo nivel del factor A, y_ij. = es la media de observaciones para el ^j-ésimo nivel del factor B en el i^ésimo nivel del factor A. El parámetro β _j(i) es el efecto específico de B cuando A está en el i^ésimo nivel.

Para obtener información sobre el modelo con un diseño no balanceado, véase Neter¹.

J. Neter, W. Wasserman y M.H. Kutner (1985). Applied Linear Statistical Models. Second Edition. Irwin, Inc.

Suma secuencial de los cuadrados

La suma de distancias cuadradas. La SC Total es la variación total en los datos. SC (A) y SC (B) es la cantidad de variación de la media de nivel de factor estimada alrededor de la media general. También son conocidas como la suma de los cuadrados del factor A o el factor B. La SC error es la cantidad de variación de las observaciones de los valores ajustados. Los cálculos son:

Minitab proporciona la suma secuencial de los cuadrados, que dependen del orden en que los factores hayan sido ingresados en el modelo. Es la porción única de la SC Regresión explicada por un factor, dados los factores ingresados previamente.

Notación

Término	Description
a	número de niveles en el factor A
b	número de niveles en el factor B
n	Número total de ensayos
y_i..	media del i^ésimo nivel de factor del factor A
y...	media general de todas las observaciones
y_.j.	media del j^ésimo nivel de factor del factor B
y_ij.	media de observaciones en el i^ésimo nivel del factor A y el j^ésimo nivel del factor B

Grados de libertad (GL)

Para un modelo ANOVA completamente anidado con dos factores, A y B, los grados de libertad son:

donde a = el número de niveles en el factor A, b = el número de niveles en el factor B y n es el numero de ensayos.

Cuadrado medio (CM)

Fórmulas

F

Estas son las fórmulas de los estadísticos F para un modelo con factores aleatorios.

Fórmulas

Valor p – Tabla Análisis de varianza

El valor p es una probabilidad que se calcula a partir de una distribución F con los grados de libertad (GL) que se indican a continuación:

GL del numerador: suma de los grados de libertad para el término o los términos en la prueba
GL del denominador: grados de libertad para el error

Fórmula

1 − P(F ≤ f_j)

Notación

Término	Description
P(F ≤ f)	función de distribución acumulada para la distribución F
f	estadístico F para la prueba

Componentes de la varianza

Calculados para factores aleatorios. El modelo anidado con dos factores aleatorios es:

donde, α_i, β_j(i), y ε_ijk son variables aleatorias normales independientes. Las variables son normalmente distribuidas, con media cero y varianzas dadas por V(α_i) = σ²_α,V(β_j) = σ²_β, y V(ε_ijk) = σ². Se asume que todos b_j(i) tienen la misma varianza σ²_β, σ²_α, σ²_β, σ²_αβ, σ² se denominan componentes de la varianza.

Cuadrados medios esperados

Para un modelo con dos factores aleatorios, A y B, los cuadrados medios esperados son:

Estadístico F para modelos con factores aleatorios

Cómo se calculan los estadísticos F en la salida de ANOVA

Cada estadístico F es una relación de cuadrados medios. El numerador es el cuadrado medio del término. El denominador se escoge de manera que el valor esperado del cuadrado medio del numerador difiera del valor esperado del cuadrado medio del denominador solo por el efecto de interés. El efecto de un término aleatorio está representado por el componente de la varianza del término. El efecto de un término fijo está representado por la suma de los cuadrados de los componentes del modelo asociados con ese término dividida entre sus grados de libertad. Por lo tanto, un estadístico F alto indica un efecto significativo.

Cuando todos los términos del modelo son fijos, el denominador para cada estadístico F es el cuadrado medio del error (MSE). Sin embargo, para los modelos que incluyen términos aleatorios, el MSE no siempre es el cuadrado medio correcto. Los cuadrados medios esperados (EMS) pueden utilizarse para determinar qué es lo apropiado para el denominador.

Ejemplo

Supongamos que usted realizó un ANOVA con el factor fijo Pantalla y el factor aleatorio Tecno y obtiene la siguiente salida para el EMS:

Fuente	Cuadrado medio esperado para cada término
(1) Pantalla	(4) + 2.00(3) + Q[1]
(2) Tecno	(4) + 2,0000(3) + 4,0000(2)
(3) Pantalla*Tecno	(4) + 2,0000(3)
(4) Error	(4)

Un número entre paréntesis indica un efecto aleatorio asociado con el término que aparece al lado del número de la fuente. (2) representa el efecto aleatorio de Tecno, (3) representa el efecto aleatorio de la interacción Pantalla*Tecno y (4) representa el efecto aleatorio del Error. El EMS para Error es el efecto del término de error. Además, el EMS para Pantalla*Tecno es el efecto del término de error más dos veces el efecto de la interacción Pantalla*Tecno.

Para calcular el estadístico F de Pantalla*Tecno, el cuadrado medio de Pantalla*Tecno se divide entre el cuadrado medio del error de modo que el valor esperado del numerador (EMS para Pantalla*Tecno = (4) + 2.00(3)) difiera del valor esperado del denominador (EMS para Error = (4)) solo por el efecto de la interacción (2.00(3)). Por lo tanto, un estadístico F alto indica una interacción Pantalla*Tecno significativa.

Un número con Q[ ] indica el efecto fijo asociado con el término que aparece al lado del número de la fuente. Por ejemplo, Q[1] es el efecto fijo de Pantalla. El EMS para Pantalla es el efecto del término de error más dos veces el efecto de la interacción Pantalla*Tecno más una constante multiplicada por el efecto de Pantalla. Q[1] es igual a (b*n * suma((coeficientes de los niveles de Pantalla)**2)) dividido entre (a - 1), donde a y b son el número de niveles de Pantalla y Tecno, respectivamente, y n es el número de réplicas.

Para calcular el estadístico F para Pantalla, el cuadrado medio de Pantalla se divide entre el cuadrado medio de Pantalla*Tecno de modo que el valor esperado del numerador (EMS para Pantalla = (4) + 2.0000(3) + Q[1]) difiera del valor esperado del denominador (EMS para Pantalla*Tecno = (4) + 2.0000(3) ) solo por el efecto debido a la Pantalla (Q[1]). Por lo tanto, un estadístico F alto indica un efecto significativo de Pantalla.

¿Por qué incluye la salida de mi ANOVA una "x" al lado del valor p en la tabla ANOVA y la etiqueta "No es una prueba F exacta"?

Una prueba F exacta para un término es aquella en la que el valor esperado de los cuadrados medios del numerador difiere del valor esperado de los cuadrados medios del denominador solo por el componente de la varianza o el factor fijo de interés.

Sin embargo, a veces no es posible calcular ese cuadrado medio. En ese caso, Minitab utiliza un cuadrado medio que da como resultado una prueba F aproximada y muestra una "x" al lado el valor p para indicar que la prueba F no es exacta.

Por ejemplo, supongamos que usted realizó un ANOVA con el factor fijo Suplemento y el factor aleatorio Lago y obtuvo la siguiente salida para los cuadrados medios esperados (EMS):

Fuente	Cuadrado medio esperado para cada término
(1) Suplemento	(4) + 1,7500(3) + Q[1]
(2) Lago	(4) + 1,7143(3) + 5,1429(2)
(3) Suplemento*Lago	(4) + 1,7500(3)
(4) Error	(4)

El estadístico F para Suplemento es el cuadrado medio de Suplemento dividido entre el cuadrado medio de la interacción Suplemento*Lago. Si el efecto para Suplemento es muy pequeño, el valor esperado del numerador es igual al valor esperado del denominador. Este es un ejemplo de una prueba F exacta.

Sin embargo, observe que para un efecto muy pequeño de Lago no hay cuadrados medios tales que el valor esperado del numerador sea igual al valor esperado del denominador. Por lo tanto, Minitab utiliza una prueba F aproximada. En este ejemplo, el cuadrado medio de Lago se divide entre el cuadrado medio de la interacción Suplemento*Lago. Esto da como resultado un valor esperado del numerador que es aproximadamente igual al del denominador si el efecto de Lago es muy pequeño.

Acerca del mensaje "El denominador de la prueba F es cero o no está definido"

Minitab mostrará un mensaje de error indicando que el denominador de la prueba F es cero o no está definido, por una de las siguientes razones:

No hay al menos un grado de libertad para el error.
Los valores ajustados de CM son muy pequeños y por lo tanto no hay suficiente precisión para mostrar los valores p y F. Como una solución, multiplique la columna de respuesta por 10. Entonces ejecute el mismo modelo de regresión, pero en cambio utilice esta nueva columna de respuesta para la respuesta.

Nota
Multiplicar los valores de respuesta por 10 no afectará los valores F y p que Minitab muestra en la salida. Sin embargo, la posición decimal se verá afectada en la salida restante, específicamente, las sumas secuenciales de los cuadrados, SC Ajust., CM Ajust., Ajuste, error estándar de los ajustes y las columnas de residuos.

Cómo se calculan los estadísticos F en la salida de ANOVA

Cada estadístico F es una relación de cuadrados medios. El numerador es el cuadrado medio del término. El denominador se escoge de manera que el valor esperado del cuadrado medio del numerador difiera del valor esperado del cuadrado medio del denominador solo por el efecto de interés. El efecto de un término aleatorio está representado por el componente de la varianza del término. El efecto de un término fijo está representado por la suma de los cuadrados de los componentes del modelo asociados con ese término dividida entre sus grados de libertad. Por lo tanto, un estadístico F alto indica un efecto significativo.

Cuando todos los términos del modelo son fijos, el denominador para cada estadístico F es el cuadrado medio del error (MSE). Sin embargo, para los modelos que incluyen términos aleatorios, el MSE no siempre es el cuadrado medio correcto. Los cuadrados medios esperados (EMS) pueden utilizarse para determinar qué es lo apropiado para el denominador.

Ejemplo

Supongamos que usted realizó un ANOVA con el factor fijo Pantalla y el factor aleatorio Tecno y obtiene la siguiente salida para el EMS:

Fuente	Cuadrado medio esperado para cada término
(1) Pantalla	(4) + 2.00(3) + Q[1]
(2) Tecno	(4) + 2,0000(3) + 4,0000(2)
(3) Pantalla*Tecno	(4) + 2,0000(3)
(4) Error	(4)

Un número entre paréntesis indica un efecto aleatorio asociado con el término que aparece al lado del número de la fuente. (2) representa el efecto aleatorio de Tecno, (3) representa el efecto aleatorio de la interacción Pantalla*Tecno y (4) representa el efecto aleatorio del Error. El EMS para Error es el efecto del término de error. Además, el EMS para Pantalla*Tecno es el efecto del término de error más dos veces el efecto de la interacción Pantalla*Tecno.

Para calcular el estadístico F de Pantalla*Tecno, el cuadrado medio de Pantalla*Tecno se divide entre el cuadrado medio del error de modo que el valor esperado del numerador (EMS para Pantalla*Tecno = (4) + 2.00(3)) difiera del valor esperado del denominador (EMS para Error = (4)) solo por el efecto de la interacción (2.00(3)). Por lo tanto, un estadístico F alto indica una interacción Pantalla*Tecno significativa.

Un número con Q[ ] indica el efecto fijo asociado con el término que aparece al lado del número de la fuente. Por ejemplo, Q[1] es el efecto fijo de Pantalla. El EMS para Pantalla es el efecto del término de error más dos veces el efecto de la interacción Pantalla*Tecno más una constante multiplicada por el efecto de Pantalla. Q[1] es igual a (b*n * suma((coeficientes de los niveles de Pantalla)**2)) dividido entre (a - 1), donde a y b son el número de niveles de Pantalla y Tecno, respectivamente, y n es el número de réplicas.

Para calcular el estadístico F para Pantalla, el cuadrado medio de Pantalla se divide entre el cuadrado medio de Pantalla*Tecno de modo que el valor esperado del numerador (EMS para Pantalla = (4) + 2.0000(3) + Q[1]) difiera del valor esperado del denominador (EMS para Pantalla*Tecno = (4) + 2.0000(3) ) solo por el efecto debido a la Pantalla (Q[1]). Por lo tanto, un estadístico F alto indica un efecto significativo de Pantalla.

¿Por qué incluye la salida de mi ANOVA una "x" al lado del valor p en la tabla ANOVA y la etiqueta "No es una prueba F exacta"?

Una prueba F exacta para un término es aquella en la que el valor esperado de los cuadrados medios del numerador difiere del valor esperado de los cuadrados medios del denominador solo por el componente de la varianza o el factor fijo de interés.

Sin embargo, a veces no es posible calcular ese cuadrado medio. En ese caso, Minitab utiliza un cuadrado medio que da como resultado una prueba F aproximada y muestra una "x" al lado el valor p para indicar que la prueba F no es exacta.

Por ejemplo, supongamos que usted realizó un ANOVA con el factor fijo Suplemento y el factor aleatorio Lago y obtuvo la siguiente salida para los cuadrados medios esperados (EMS):

Fuente	Cuadrado medio esperado para cada término
(1) Suplemento	(4) + 1,7500(3) + Q[1]
(2) Lago	(4) + 1,7143(3) + 5,1429(2)
(3) Suplemento*Lago	(4) + 1,7500(3)
(4) Error	(4)

El estadístico F para Suplemento es el cuadrado medio de Suplemento dividido entre el cuadrado medio de la interacción Suplemento*Lago. Si el efecto para Suplemento es muy pequeño, el valor esperado del numerador es igual al valor esperado del denominador. Este es un ejemplo de una prueba F exacta.

Sin embargo, observe que para un efecto muy pequeño de Lago no hay cuadrados medios tales que el valor esperado del numerador sea igual al valor esperado del denominador. Por lo tanto, Minitab utiliza una prueba F aproximada. En este ejemplo, el cuadrado medio de Lago se divide entre el cuadrado medio de la interacción Suplemento*Lago. Esto da como resultado un valor esperado del numerador que es aproximadamente igual al del denominador si el efecto de Lago es muy pequeño.

Acerca del mensaje "El denominador de la prueba F es cero o no está definido"

Minitab mostrará un mensaje de error indicando que el denominador de la prueba F es cero o no está definido, por una de las siguientes razones:

No hay al menos un grado de libertad para el error.
Los valores ajustados de CM son muy pequeños y por lo tanto no hay suficiente precisión para mostrar los valores p y F. Como una solución, multiplique la columna de respuesta por 10. Entonces ejecute el mismo modelo de regresión, pero en cambio utilice esta nueva columna de respuesta para la respuesta.

Nota
Multiplicar los valores de respuesta por 10 no afectará los valores F y p que Minitab muestra en la salida. Sin embargo, la posición decimal se verá afectada en la salida restante, específicamente, las sumas secuenciales de los cuadrados, SC Ajust., CM Ajust., Ajuste, error estándar de los ajustes y las columnas de residuos.

Métodos y fórmulas para la ANOVA completamente anidado

En este tema

Modelo ANOVA completamente anidado

Suma secuencial de los cuadrados

Notación

Grados de libertad (GL)

Cuadrado medio (CM)

Fórmulas

F

Fórmulas

Valor p – Tabla Análisis de varianza

Fórmula

Notación

Componentes de la varianza

Cuadrados medios esperados

Estadístico F para modelos con factores aleatorios

Cómo se calculan los estadísticos F en la salida de ANOVA

Ejemplo

¿Por qué incluye la salida de mi ANOVA una "x" al lado del valor p en la tabla ANOVA y la etiqueta "No es una prueba F exacta"?

Acerca del mensaje "El denominador de la prueba F es cero o no está definido"

Nota

Cómo se calculan los estadísticos F en la salida de ANOVA

Ejemplo

¿Por qué incluye la salida de mi ANOVA una "x" al lado del valor p en la tabla ANOVA y la etiqueta "No es una prueba F exacta"?

Acerca del mensaje "El denominador de la prueba F es cero o no está definido"

Nota