Interpretar los resultados clave para ANOVA balanceado

Complete los siguientes pasos para interpretar un ANOVA balanceado. El resultado fundamental incluye el valor p, las medias de grupos, R2 y las gráficas de residuos.

Paso 1: Determinar si la asociación entre la respuesta y el término es estadísticamente significativa

Para determinar si la asociación entre la respuesta y cada término incluido en el modelo es estadísticamente significativa, compare el valor p del término con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que no hay asociación entre el término y la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el término.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que existe una asociación estadísticamente significativa entre la variable de respuesta y el término. Convendría que vuelva a ajustar el modelo sin el término.
Si hay múltiples predictores sin una asociación estadísticamente significativa con la respuesta, usted puede reducir el modelo eliminando términos uno a la vez. Para obtener más información sobre cómo eliminar términos del modelo, vaya a Reducción del modelo.
Para este análisis en Minitab, el modelo debe ser jerárquico. En un modelo jerárquico, todos los términos de orden inferior que conforman los términos de orden superior también aparecen en el modelo. Por ejemplo, un modelo que incluye los términos de interacción A*B*C es jerárquico si incluye estos términos: A, B, C, A*B, A*C y B*C.
Si un término del modelo es estadísticamente significativo, la interpretación depende del tipo de término. Las interpretaciones son las siguientes:
  • Si un factor fijo es significativo, usted puede concluir que no todas las medias de nivel son iguales.
  • Si un factor aleatorio es significativo, puede concluir que el factor contribuye a la cantidad de variación en la respuesta.
  • Si un término de interacción es significativo, la relación entre un factor y la respuesta depende del resto de los factores incluidos en el término. En este caso, usted no debe interpretar los efectos principales sin considerar el efecto de interacción.

Utilice la tabla Medias para entender las diferencias estadísticamente significativas entre los niveles de los factores en sus datos. La media de cada grupo proporciona una estimación de cada media de población. Busque diferencias entre las medias de grupo para los términos que son estadísticamente significativos.

Para los efectos principales, la tabla muestra los grupos dentro de cada factor y sus medias. Para los efectos de interacción, la tabla muestra todas las combinaciones posibles de los grupos. Si un término de interacción es estadísticamente significativo, no interprete los efectos principales sin considerar los efectos de interacción.

Información del factor

FactorTipoNivelesValores
TiempoFijo21, 2
OperadorAleatorio31, 2, 3
PosiciónFijo335, 44, 52

Análisis de varianza de Grosor

FuenteGLSCMCFP
  Tiempo19.09.000.290.644 
  Operador21120.9560.444.280.081x
  Posición215676.47838.1973.180.001 
  Tiempo*Operador262.031.004.340.026 
  Tiempo*Posición2114.557.258.020.002 
  Operador*Posición4428.4107.1115.010.000 
Error22157.07.14     
Total3517568.2       
x No es una prueba F exacta.

Resumen del modelo

SR-cuadradoR-cuadrado(ajustado)
2.6714099.11%98.58%

Términos de error para pruebas

FuenteComponente
de la
varianza
Término
de error
Media de cuadrados esperada
para cada término (usando el
modelo no restringido)
1Tiempo  4(7) + 6 (4) + Q[1, 5]
2Operador35.789*(7) + 4 (6) + 6 (4) + 12 (2)
3Posición  6(7) + 4 (6) + Q[3, 5]
4Tiempo*Operador3.9777(7) + 6 (4)
5Tiempo*Posición  7(7) + Q[5]
6Operador*Posición24.9947(7) + 4 (6)
7Error7.136  (7)
* Prueba sintetizada.

Términos de error para pruebas sintetizadas

FuenteGL de errorMC de errorSíntesis de MC
de error
2Operador5.12130.9747(4) + (6) - (7)

Medias

TiempoNGrosor
11867.7222
21868.7222
PosiciónNGrosor
351240.5833
441273.0833
521291.0000
Tiempo*PosiciónNGrosor
1 35640.6667
1 44670.1667
1 52692.3333
2 35640.5000
2 44676.0000
2 52689.6667
Resultados clave: Valor p, tabla Medias

La configuración es un factor fijo y este efecto principal es significativo. Este resultado indica que la media del grosor del recubrimiento no es igual para todas las configuraciones de máquina.

Hora*Configuración es un efecto de interacción que implica dos factores fijos. Este efecto de interacción es significativo, lo cual indica que la relación entre cada factor y la respuesta depende del nivel del otro factor. En este caso, no se deben interpretar los efectos principales sin considerar el efecto de interacción.

En estos resultados, la tabla Medias muestra la variación en la media de grosor según el tiempo, la configuración de la máquina y cada combinación de tiempo y configuración de la máquina. El valor de configuración es estadísticamente significativo y las medias difieren entre las configuraciones de la máquina. Sin embargo, puesto que el término de interacción Tiempo*Configuración también es estadísticamente significativo, no interprete los efectos principales sin considerar los efectos de interacción. Por ejemplo, la tabla para el término de interacción muestra que con una configuración de 44, el tiempo 2 está asociado con un recubrimiento más grueso. Sin embargo, con una configuración de 52, el tiempo 1 está asociado con un recubrimiento más grueso.

El operador es un factor aleatorio y todas las interacciones que incluyen un factor aleatorio son consideradas aleatorias. Si un factor aleatorio es significativo, se puede concluir que el factor contribuye a la cantidad de variación en la respuesta. El operador no es significativo al nivel de 0.05, pero los efectos de interacción que incluye el operador son significativos. Estos efectos de interacción indican que la cantidad de variación con la que el operador contribuye a la respuesta depende del valor tanto de hora como configuración de máquina.

Paso 2: Determinar hasta qué punto el modelo se ajusta a los datos

Para determinar qué tan bien se ajusta el modelo a los datos, examine los estadísticos de bondad de ajuste en la tabla Resumen del modelo.

S

Utilice S para evaluar qué tan bien el modelo describe la respuesta. Utilice S en lugar de los estadísticos R2 para comparar el ajuste de los modelos que no tienen una constante.

S se mide en las unidades de la variable de respuesta y representa la distancia que separa a los valores de los datos de los valores ajustados. Mientras más bajo sea el valor de S, mejor describirá el modelo la respuesta. Sin embargo, un valor de S bajo no indica por sí solo que el modelo cumple con los supuestos del modelo. Debe examinar las gráficas de residuos para verificar los supuestos.

R-cuad.

Mientras mayor sea el valor de R2, mejor se ajustará el modelo a los datos. R2 siempre está entre 0% y 100%.

El R2 siempre se incrementa cuando usted agrega predictores adicionales a un modelo. Por ejemplo, el mejor modelo de cinco predictores siempre tendrá un R2 que será al menos tan alto como el mejor modelo de cuatro predictores. Por lo tanto, R2 es más útil cuando se comparan modelos del mismo tamaño.

R-cuad.(ajustado)

Utilice R2 ajustado cuando desee comparar modelos que tengan diferentes números de predictores. R2 siempre aumenta cuando se agrega un predictor al modelo, incluso cuando no haya una mejora real en el modelo. El valor de R2 ajustado incorpora el número de predictores del modelo para ayudar a elegir el modelo correcto.

Considere los siguientes puntos cuando interprete los valores R2:
  • Las muestras pequeñas no proporcionan una estimación precisa de la fuerza de la relación entre la respuesta y los predictores. Por ejemplo, si necesita que R2 sea más preciso, debe utilizar una muestra más grande (generalmente, 40 o más).

  • Los estadísticos de bondad de ajuste son simplemente una medida de qué tan bien se ajusta el modelo a los datos. Incluso cuando un modelo tenga un valor deseable, usted deberá revisar las gráficas de residuos para verificar que el modelo cumpla con los supuestos del modelo.

Resumen del modelo

SR-cuadradoR-cuadrado(ajustado)
2.6714099.11%98.58%
Resultados clave: S, R-cuad., R-cuad. (ajust)

En estos resultados, el modelo explica un 99.11 % de la variación en el grosor del recubrimiento. Para estos datos, el valor de R2 indica el modelo que ofrece un mejor ajuste para los datos. Si se ajustan modelos adicionales con diferentes predictores, utilice los valores de R2 ajustados para comparar hasta que punto el modelo se ajusta a los datos.

Paso 3: Determinar si el modelo cumple con los supuestos del análisis

Utilice las gráficas de residuos como ayuda para determinar si el modelo es adecuado y cumple con los supuestos del análisis. Si los supuestos no se cumplen, el modelo podría no ajustarse adecuadamente a los datos y se debería tener cuidado al interpretar los resultados.

Para obtener más información sobre cómo manejar los patrones en las gráficas de residuos, vaya a Gráficas de residuos para Ajustar modelo lineal general y haga clic en el nombre de la gráfica de residuos en la lista que se encuentra en la parte superior de la página.

Gráfica de residuos vs. ajustes

Utilice la gráfica de residuos vs. ajustes para verificar el supuesto de que los residuos están distribuidos aleatoriamente y tienen una varianza constante. Lo ideal es que los puntos se ubiquen aleatoriamente a ambos lados del 0, con patrones no detectables en los puntos.

Los patrones que se observan en la siguiente tabla podrían indicar que el modelo no cumple con los supuestos del modelo.
Patrón Lo que podría indicar el patrón
Dispersión en abanico o irregular de los residuos en los valores ajustados Varianza no constante
Curvilíneo Un término de orden superior faltante
Un punto que está alejado de cero Un valor atípico
Un punto que está lejos de los otros puntos en la dirección x Un punto influyente
En esta gráfica de residuos vs. ajustes, los datos parecen estar distribuidos aleatoriamente alrededor de cero. No existe evidencia de que el valor del residuo dependa del valor ajustado.

Gráfica de residuos vs. orden

Utilice la gráfica de residuos vs. orden para verificar el supuesto de que los residuos son independientes entre sí. Los residuos independientes no muestran tendencias ni patrones cuando se muestran en orden cronológico. Los patrones en los puntos podrían indicar que los residuos que están cercanos entre sí podrían estar correlacionados y, por lo tanto, podrían no ser independientes. Lo ideal es que los residuos que se muestran en la gráfica se ubiquen aleatoriamente alrededor de la línea central:
Si observa un patrón, investigue la causa. Los siguientes tipos de patrones pueden indicar que los residuos son dependientes.
Tendencia
Cambio
Ciclo
En esta gráfica de residuos vs. orden, los residuos parecen estar ubicados aleatoriamente alrededor de la línea central. No hay evidencia de que los residuos no sean independientes.

Gráfica de probabilidad normal

Utilice la gráfica de probabilidad normal de los residuos para verificar el supuesto de que los residuos están distribuidos normalmente. La gráfica de probabilidad normal de los residuos debe seguir aproximadamente una línea recta.

Los patrones que se observan en la siguiente tabla podrían indicar que el modelo no cumple con los supuestos del modelo.
Patrón Lo que podría indicar el patrón
No una línea recta No normalidad
Un punto que está alejado de la línea Un valor atípico
Pendiente cambiante Una variable no identificada
En esta gráfica de probabilidad normal, los puntos generalmente siguen una línea recta. No hay evidencia de no normalidad, valores atípicos o variables no identificadas.