Interpretar los resultados clave para Ajustar modelo de efectos mixtos

Complete los siguientes pasos para interpretar un modelo de efectos mixtos.

Paso 1: Determinar si los términos aleatorios afectan significativamente la respuesta

Para determinar si un término aleatorio afecta significativamente la respuesta, compare el valor p del término indicado en la tabla Componentes de la varianza con el nivel de significancia. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe un efecto cuando no hay un efecto real.
Valor p ≤ α: El término aleatorio afecta significativamente la respuesta
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que el término aleatorio no afecta significativamente la respuesta. Esto significa que la varianza del término aleatorio es significativamente diferente de cero.
Valor p > α: El término aleatorio no afecta significativamente la respuesta
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que el término aleatorio afecta significativamente la respuesta. Convendría que vuelva a ajustar el modelo sin el término insignificante para evaluar el efecto del término en otros resultados.

Componentes de la varianza

FuenteVar% del totalEE de la
var.
Valor ZValor p
Campo0.07791972.93%0.0675801.1529960.124
Error0.02892427.07%0.0105622.7386130.003
Total0.106843       
-2 log likelihood = 7.736012
Resultados clave: Valor p

En estos resultados, Campo es el término aleatorio y el valor p de Campo es 0.124. Puesto que este valor es mayor que 0.05, usted no tiene suficiente evidencia para concluir que los diferentes campos contribuyen a la cantidad de variación en el rendimiento.

Paso 2: Determinar si los términos de efecto fijo afectan significativamente la respuesta

Para determinar si un término afecta significativamente la respuesta, compare el valor p con el nivel de significancia. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe un efecto cuando no hay un efecto real.

La interpretación de cada valor p depende de si corresponde al coeficiente de un término de factor fijo o a un término de covariable.

Término de factor fijo

Para un término de factor fijo, la hipótesis nula es que el término de factor fijo no afecta significativamente la respuesta.
Valor p ≤ α: El término de factor fijo afecta significativamente la respuesta

Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que el término de factor fijo no afecta significativamente la respuesta. El rechazo de la hipótesis nula indica que el efecto de un nivel es significativamente diferente de los efectos de los otros niveles del término.

Valor p > α: El término de factor fijo no afecta significativamente la respuesta
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que el término de factor fijo afecta significativamente la respuesta. Convendría que vuelva a ajustar el modelo sin el término.

Término de covariable

Para un término de covariable, la hipótesis nula es que no existe asociación entre el término y la respuesta.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la respuesta y el término de covariable.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que existe una asociación estadísticamente significativa entre la respuesta y el término de covariable. Convendría que vuelva a ajustar el modelo sin el término de covariable.

Pruebas de efectos fijos

TérminoGL NumGL DenValor FValor p
Variedad5.0015.0026.290.000
Resultados clave: Valores p

Variedad es el término de factor fijo y el valor p del término Variedad es menor que 0.000. Puesto que este valor es menor que 0.05, usted puede concluir que todas las medias de nivel no son iguales, lo que significa la variedad de alfalfa tiene un efecto en el rendimiento.

Para entender mejor los efectos principales, vaya a Gráficas factoriales.

Paso 3: Determinar qué tan bien se ajusta el modelo a los datos

Para determinar qué tan bien se ajusta el modelo a los datos, examine los estadísticos de bondad de ajuste en la tabla Resumen del modelo.

S

S es la desviación estándar estimada del término de error. Cuanto menor sea el valor de S, mejor describirá la ecuación ajustada condicional la respuesta con la configuración seleccionada de los factores. Sin embargo, un valor de S por sí solo no describe completamente lo adecuado del modelo. Examine también los resultados clave de otras tablas y las gráficas de residuos.

R-cuad.

El R2 es el porcentaje de variación en la respuesta que es explicada por el modelo. Se calcula como 1 menos la relación de la suma de los cuadrados del error (que es la variación que no es explicada por el modelo) a la suma total de los cuadrados (que es la variación total en el modelo).

R-cuad. (ajust)

Utilice el R2 ajustado cuando desee comparar modelos con la misma estructura de covarianzas pero tenga un número diferente de factores fijos y covariables. Suponiendo que los modelos tienen la misma estructura de covarianzas, el R2 aumenta cuando usted agrega otros factores fijos o covariables. El valor de R2 ajustado incorpora el número de factores fijos y covariables incluidos en el modelo para ayudar a elegir el modelo correcto.

AICc y BIC
Cuando usted muestra los resultados expandidos del análisis, Minitab muestra dos estadísticos más. Estos estadísticos son el criterio de información de Akaike corregido (AICc) y el criterio de información bayesiano (BIC). Utilice estos estadísticos para comparar diferentes modelos. Para cada estadístico, se prefieren valores más pequeños.
Considere los siguientes puntos cuando interprete los estadísticos de bondad de ajuste:
  • Para obtener estimaciones más precisas y menos sesgadas de los parámetros de un modelo, por lo general, el número de filas de un conjunto de datos debe ser mucho mayor que el número de parámetros del modelo. Para obtener estimaciones razonablemente buenas para los componentes de la varianza de los términos aleatorios, usted debería tener suficientes niveles representativos de cada factor aleatorio.

  • Los estadísticos de bondad de ajuste son simplemente una medida de qué tan bien se ajusta el modelo a los datos. Incluso cuando un modelo tenga un valor deseable, usted deberá revisar las gráficas de residuos para verificar que el modelo cumpla con los supuestos del modelo.

Resumen del modelo

SR-cuadradoR-cuadrado(ajustado)AICcBIC
0.17007192.33%90.20%12.5413.52
Resultados clave: S, R-cuad., R-cuad. (ajust)

En estos resultados, la desviación estándar estimada (S) del término de error aleatorio es 0,17. El modelo explica 92,33% de la variación en el rendimiento de las plantas de alfalfa. Después de ajustar para el número de parámetros de factor fijo incluidos en el modelo, el porcentaje se reduce a 90,2%.

Paso 4: Evaluar cómo cada nivel de un término de efecto fijo afecta la respuesta

Si el valor p indica que un término es significativo, usted puede examinar los coeficientes del término para entender cómo se relaciona el término con la respuesta. La interpretación de cada coeficiente depende de si corresponde a un término de factor fijo o a un término de covariable.

Los coeficientes para un término de factor fijo muestran qué tan diferentes son las medias de nivel para el término. También puede realizar un análisis de comparaciones múltiples con respecto al término para clasificar aún más los efectos de nivel en grupos que sean estadísticamente iguales o estadísticamente diferentes.

El coeficiente para un término de covariable representa el cambio en la respuesta media asociado a un cambio de 1 unidad en ese término, en tanto que los otros términos incluidos en el modelo se mantienen iguales. El signo del coeficiente indica la dirección de la relación entre el término y la respuesta. El tamaño del coeficiente suele ser una buena manera de evaluar la significancia práctica del efecto del término sobre la variable de respuesta.

Coeficientes

TérminoCoefEE del coef.GLValor TValor p
Constante3.0945830.1438223.0021.5166920.000
Variedad         
  10.3854170.07762615.004.9650160.000
  20.1454170.07762615.001.8732870.081
  30.1079170.07762615.001.3902050.185
  4-0.3195830.07762615.00-4.1169380.001
  50.3954170.07762615.005.0938380.000
Resultados clave: Coeficientes

De las seis variedades de alfalfa incluidas en el experimento, la salida muestra los coeficientes para cinco tipos. Por opción predeterminada, Minitab elimina un nivel de factor para evitar la multicolinealidad perfecta. Los coeficientes de los efectos principales representan la diferencia entre cada media de nivel y la media general. Por ejemplo, la Variedad 1 está asociada a un rendimiento de alfalfa que es aproximadamente 0.385 unidades mayor que la media general.

Paso 5: Determinar si el modelo cumple con los supuestos del análisis

Utilice las gráficas de residuos como ayuda para determinar si el modelo es adecuado y cumple con los supuestos del análisis. Si los supuestos no se cumplen, el modelo podría no ajustarse adecuadamente a los datos y se debería tener cuidado al interpretar los resultados.

Nota

Usted puede graficar los residuos marginales y condicionales. Un residuo marginal es igual a la diferencia entre un valor de respuesta observado y la respuesta media estimada correspondiente sin condicionamiento de los niveles de los factores aleatorios. Por el contrario, dados los niveles específicos de los factores aleatorios, un residuo condicional equivale a la diferencia entre un valor de respuesta observado y la respuesta media condicional correspondiente. Utilice los residuos condicionales para verificar la normalidad del término de error en el modelo.

Gráfica de residuos vs. ajustes

La gráfica de residuos vs. ajustes muestra los residuos en el eje Y y los valores ajustados en el eje X. Utilice esta gráfica para identificar las filas de datos con residuos mucho más grandes que los de otras filas. Investigue más a fondo esas filas para determinar si se recolectaron correctamente. Además, también puede utilizar esta gráfica para buscar patrones específicos en los residuos que pudieran indicar variables adicionales que habría que considerar.

Gráfica de residuos vs. orden

La gráfica de residuos vs. orden muestra los residuos en el orden en que se recopilaron los datos. Utilice esta gráfica para identificar las filas de datos con residuos mucho más grandes que los de otras filas. Investigue más a fondo esas filas para determinar si se recolectaron correctamente. Si la gráfica muestra un patrón en orden cronológico, puede tratar de incluir un término dependiente del tiempo en el modelo para eliminar el patrón.