El modelo ANOVA anidado para un diseño balanceado con dos factores aleatorios (A y B) es:
yijk = μ .. + α i+ β j(i) +εijk
donde α i, β j(i) y ε ijkson variables aleatorias normales independientes con expectativas 0 y varianzas σ2α, σ2β y σ2, respectivamente.
Los parámetros se estiman mediante lo siguiente:
μ .. = y̅...
α i = yi..− y̅...
β j(i) = yij.− y̅i..
donde y̅... = media de todas las observaciones, yi.. = media de observaciones en el iésimo nivel del factor A, yij. = es la media de observaciones para el j-ésimo nivel del factor B en el iésimo nivel del factor A. El parámetro β j(i) es el efecto específico de B cuando A está en el iésimo nivel.
La suma de distancias cuadradas. La SC Total es la variación total en los datos. SC (A) y SC (B) es la cantidad de variación de la media de nivel de factor estimada alrededor de la media general. También son conocidas como la suma de los cuadrados del factor A o el factor B. La SC error es la cantidad de variación de las observaciones de los valores ajustados. Los cálculos son:
Minitab proporciona la suma secuencial de los cuadrados, que dependen del orden en que los factores hayan sido ingresados en el modelo. Es la porción única de la SC Regresión explicada por un factor, dados los factores ingresados previamente.
Término | Description |
---|---|
a | número de niveles en el factor A |
b | número de niveles en el factor B |
n | Número total de ensayos |
yi.. | media del iésimo nivel de factor del factor A |
y... | media general de todas las observaciones |
y.j. | media del jésimo nivel de factor del factor B |
yij. | media de observaciones en el iésimo nivel del factor A y el jésimo nivel del factor B |
Para un modelo ANOVA completamente anidado con dos factores, A y B, los grados de libertad son:
donde a = el número de niveles en el factor A, b = el número de niveles en el factor B y n es el numero de ensayos.
Estas son las fórmulas de los estadísticos F para un modelo con factores aleatorios.
El valor p es una probabilidad que se calcula a partir de una distribución F con los grados de libertad (GL) que se indican a continuación:
1 − P(F ≤ fj)
Término | Description |
---|---|
P(F ≤ f) | función de distribución acumulada para la distribución F |
f | estadístico F para la prueba |
Calculados para factores aleatorios. El modelo anidado con dos factores aleatorios es:
donde, αi, βj(i), y εijk son variables aleatorias normales independientes. Las variables son normalmente distribuidas, con media cero y varianzas dadas por V(αi) = σ2α,V(βj) = σ2β, y V(εijk) = σ2. Se asume que todos bj(i) tienen la misma varianza σ2β, σ2α, σ2β, σ2αβ, σ2 se denominan componentes de la varianza.
Para un modelo con dos factores aleatorios, A y B, los cuadrados medios esperados son:
Cada estadístico F es una relación de cuadrados medios. El numerador es el cuadrado medio del término. El denominador se escoge de manera que el valor esperado del cuadrado medio del numerador difiera del valor esperado del cuadrado medio del denominador solo por el efecto de interés. El efecto de un término aleatorio está representado por el componente de la varianza del término. El efecto de un término fijo está representado por la suma de los cuadrados de los componentes del modelo asociados con ese término dividida entre sus grados de libertad. Por lo tanto, un estadístico F alto indica un efecto significativo.
Cuando todos los términos del modelo son fijos, el denominador para cada estadístico F es el cuadrado medio del error (MSE). Sin embargo, para los modelos que incluyen términos aleatorios, el MSE no siempre es el cuadrado medio correcto. Los cuadrados medios esperados (EMS) pueden utilizarse para determinar qué es lo apropiado para el denominador.
Fuente | Cuadrado medio esperado para cada término |
---|---|
(1) Pantalla | (4) + 2.00(3) + Q[1] |
(2) Tecno | (4) + 2,0000(3) + 4,0000(2) |
(3) Pantalla*Tecno | (4) + 2,0000(3) |
(4) Error | (4) |
Un número entre paréntesis indica un efecto aleatorio asociado con el término que aparece al lado del número de la fuente. (2) representa el efecto aleatorio de Tecno, (3) representa el efecto aleatorio de la interacción Pantalla*Tecno y (4) representa el efecto aleatorio del Error. El EMS para Error es el efecto del término de error. Además, el EMS para Pantalla*Tecno es el efecto del término de error más dos veces el efecto de la interacción Pantalla*Tecno.
Para calcular el estadístico F de Pantalla*Tecno, el cuadrado medio de Pantalla*Tecno se divide entre el cuadrado medio del error de modo que el valor esperado del numerador (EMS para Pantalla*Tecno = (4) + 2.00(3)) difiera del valor esperado del denominador (EMS para Error = (4)) solo por el efecto de la interacción (2.00(3)). Por lo tanto, un estadístico F alto indica una interacción Pantalla*Tecno significativa.
Un número con Q[ ] indica el efecto fijo asociado con el término que aparece al lado del número de la fuente. Por ejemplo, Q[1] es el efecto fijo de Pantalla. El EMS para Pantalla es el efecto del término de error más dos veces el efecto de la interacción Pantalla*Tecno más una constante multiplicada por el efecto de Pantalla. Q[1] es igual a (b*n * suma((coeficientes de los niveles de Pantalla)**2)) dividido entre (a - 1), donde a y b son el número de niveles de Pantalla y Tecno, respectivamente, y n es el número de réplicas.
Para calcular el estadístico F para Pantalla, el cuadrado medio de Pantalla se divide entre el cuadrado medio de Pantalla*Tecno de modo que el valor esperado del numerador (EMS para Pantalla = (4) + 2.0000(3) + Q[1]) difiera del valor esperado del denominador (EMS para Pantalla*Tecno = (4) + 2.0000(3) ) solo por el efecto debido a la Pantalla (Q[1]). Por lo tanto, un estadístico F alto indica un efecto significativo de Pantalla.
Una prueba F exacta para un término es aquella en la que el valor esperado de los cuadrados medios del numerador difiere del valor esperado de los cuadrados medios del denominador solo por el componente de la varianza o el factor fijo de interés.
Sin embargo, a veces no es posible calcular ese cuadrado medio. En ese caso, Minitab utiliza un cuadrado medio que da como resultado una prueba F aproximada y muestra una "x" al lado el valor p para indicar que la prueba F no es exacta.
Fuente | Cuadrado medio esperado para cada término |
---|---|
(1) Suplemento | (4) + 1,7500(3) + Q[1] |
(2) Lago | (4) + 1,7143(3) + 5,1429(2) |
(3) Suplemento*Lago | (4) + 1,7500(3) |
(4) Error | (4) |
El estadístico F para Suplemento es el cuadrado medio de Suplemento dividido entre el cuadrado medio de la interacción Suplemento*Lago. Si el efecto para Suplemento es muy pequeño, el valor esperado del numerador es igual al valor esperado del denominador. Este es un ejemplo de una prueba F exacta.
Sin embargo, observe que para un efecto muy pequeño de Lago no hay cuadrados medios tales que el valor esperado del numerador sea igual al valor esperado del denominador. Por lo tanto, Minitab utiliza una prueba F aproximada. En este ejemplo, el cuadrado medio de Lago se divide entre el cuadrado medio de la interacción Suplemento*Lago. Esto da como resultado un valor esperado del numerador que es aproximadamente igual al del denominador si el efecto de Lago es muy pequeño.
Los valores ajustados de CM son muy pequeños y por lo tanto no hay suficiente precisión para mostrar los valores p y F. Como una solución, multiplique la columna de respuesta por 10. Entonces ejecute el mismo modelo de regresión, pero en cambio utilice esta nueva columna de respuesta para la respuesta.
Multiplicar los valores de respuesta por 10 no afectará los valores F y p que Minitab muestra en la salida. Sin embargo, la posición decimal se verá afectada en la salida restante, específicamente, las sumas secuenciales de los cuadrados, SC Ajust., CM Ajust., Ajuste, error estándar de los ajustes y las columnas de residuos.
Cada estadístico F es una relación de cuadrados medios. El numerador es el cuadrado medio del término. El denominador se escoge de manera que el valor esperado del cuadrado medio del numerador difiera del valor esperado del cuadrado medio del denominador solo por el efecto de interés. El efecto de un término aleatorio está representado por el componente de la varianza del término. El efecto de un término fijo está representado por la suma de los cuadrados de los componentes del modelo asociados con ese término dividida entre sus grados de libertad. Por lo tanto, un estadístico F alto indica un efecto significativo.
Cuando todos los términos del modelo son fijos, el denominador para cada estadístico F es el cuadrado medio del error (MSE). Sin embargo, para los modelos que incluyen términos aleatorios, el MSE no siempre es el cuadrado medio correcto. Los cuadrados medios esperados (EMS) pueden utilizarse para determinar qué es lo apropiado para el denominador.
Fuente | Cuadrado medio esperado para cada término |
---|---|
(1) Pantalla | (4) + 2.00(3) + Q[1] |
(2) Tecno | (4) + 2,0000(3) + 4,0000(2) |
(3) Pantalla*Tecno | (4) + 2,0000(3) |
(4) Error | (4) |
Un número entre paréntesis indica un efecto aleatorio asociado con el término que aparece al lado del número de la fuente. (2) representa el efecto aleatorio de Tecno, (3) representa el efecto aleatorio de la interacción Pantalla*Tecno y (4) representa el efecto aleatorio del Error. El EMS para Error es el efecto del término de error. Además, el EMS para Pantalla*Tecno es el efecto del término de error más dos veces el efecto de la interacción Pantalla*Tecno.
Para calcular el estadístico F de Pantalla*Tecno, el cuadrado medio de Pantalla*Tecno se divide entre el cuadrado medio del error de modo que el valor esperado del numerador (EMS para Pantalla*Tecno = (4) + 2.00(3)) difiera del valor esperado del denominador (EMS para Error = (4)) solo por el efecto de la interacción (2.00(3)). Por lo tanto, un estadístico F alto indica una interacción Pantalla*Tecno significativa.
Un número con Q[ ] indica el efecto fijo asociado con el término que aparece al lado del número de la fuente. Por ejemplo, Q[1] es el efecto fijo de Pantalla. El EMS para Pantalla es el efecto del término de error más dos veces el efecto de la interacción Pantalla*Tecno más una constante multiplicada por el efecto de Pantalla. Q[1] es igual a (b*n * suma((coeficientes de los niveles de Pantalla)**2)) dividido entre (a - 1), donde a y b son el número de niveles de Pantalla y Tecno, respectivamente, y n es el número de réplicas.
Para calcular el estadístico F para Pantalla, el cuadrado medio de Pantalla se divide entre el cuadrado medio de Pantalla*Tecno de modo que el valor esperado del numerador (EMS para Pantalla = (4) + 2.0000(3) + Q[1]) difiera del valor esperado del denominador (EMS para Pantalla*Tecno = (4) + 2.0000(3) ) solo por el efecto debido a la Pantalla (Q[1]). Por lo tanto, un estadístico F alto indica un efecto significativo de Pantalla.
Una prueba F exacta para un término es aquella en la que el valor esperado de los cuadrados medios del numerador difiere del valor esperado de los cuadrados medios del denominador solo por el componente de la varianza o el factor fijo de interés.
Sin embargo, a veces no es posible calcular ese cuadrado medio. En ese caso, Minitab utiliza un cuadrado medio que da como resultado una prueba F aproximada y muestra una "x" al lado el valor p para indicar que la prueba F no es exacta.
Fuente | Cuadrado medio esperado para cada término |
---|---|
(1) Suplemento | (4) + 1,7500(3) + Q[1] |
(2) Lago | (4) + 1,7143(3) + 5,1429(2) |
(3) Suplemento*Lago | (4) + 1,7500(3) |
(4) Error | (4) |
El estadístico F para Suplemento es el cuadrado medio de Suplemento dividido entre el cuadrado medio de la interacción Suplemento*Lago. Si el efecto para Suplemento es muy pequeño, el valor esperado del numerador es igual al valor esperado del denominador. Este es un ejemplo de una prueba F exacta.
Sin embargo, observe que para un efecto muy pequeño de Lago no hay cuadrados medios tales que el valor esperado del numerador sea igual al valor esperado del denominador. Por lo tanto, Minitab utiliza una prueba F aproximada. En este ejemplo, el cuadrado medio de Lago se divide entre el cuadrado medio de la interacción Suplemento*Lago. Esto da como resultado un valor esperado del numerador que es aproximadamente igual al del denominador si el efecto de Lago es muy pequeño.
Los valores ajustados de CM son muy pequeños y por lo tanto no hay suficiente precisión para mostrar los valores p y F. Como una solución, multiplique la columna de respuesta por 10. Entonces ejecute el mismo modelo de regresión, pero en cambio utilice esta nueva columna de respuesta para la respuesta.
Multiplicar los valores de respuesta por 10 no afectará los valores F y p que Minitab muestra en la salida. Sin embargo, la posición decimal se verá afectada en la salida restante, específicamente, las sumas secuenciales de los cuadrados, SC Ajust., CM Ajust., Ajuste, error estándar de los ajustes y las columnas de residuos.