Interpretar los resultados clave para Ajustar modelo lineal general

Complete los pasos siguientes para interpretar un modelo lineal general. La salida clave incluye el valor p, los coeficientes, R2 y las gráficas de residuos.

Paso 1: Determinar si la asociación entre la respuesta y el término es estadísticamente significativa

Para determinar si la asociación entre la respuesta y cada término incluido en el modelo es estadísticamente significativa, compare el valor p del término con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que no hay asociación entre el término y la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el término.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que existe una asociación estadísticamente significativa entre la variable de respuesta y el término. Convendría que vuelva a ajustar el modelo sin el término.
Si hay múltiples predictores sin una asociación estadísticamente significativa con la respuesta, usted puede reducir el modelo eliminando términos uno a la vez. Para obtener más información sobre cómo eliminar términos del modelo, vaya a Reducción del modelo.
Si un término del modelo es estadísticamente significativo, la interpretación depende del tipo de término. Las interpretaciones son las siguientes:
  • Si un factor fijo es significativo, usted puede concluir que no todas las medias de nivel son iguales.
  • Si un factor aleatorio es significativo, puede concluir que el factor contribuye a la cantidad de variación en la respuesta.
  • Si un término de interacción es significativo, la relación entre un factor y la respuesta depende del resto de los factores incluidos en el término. En este caso, usted no debe interpretar los efectos principales sin considerar el efecto de interacción.
  • Si una covariable es estadísticamente significativa, usted puede concluir que los cambios en el valor de la covariable están asociados a los cambios en el valor de la media de respuesta.
  • Si un término polinómico es significativo, usted puede concluir que los datos contienen curvatura.
Coeficientes EE del Término Coef coef. Valor T Valor p FIV Constante -4969 191 -25.97 0.000 Temperatura 83.87 3.13 26.82 0.000 301.00 TipoVidrio 1 1323 271 4.89 0.000 3604.00 2 1554 271 5.74 0.000 3604.00 Temperatura*Temperatura -0.2852 0.0125 -22.83 0.000 301.00 Temperatura*TipoVidrio 1 -24.40 4.42 -5.52 0.000 15451.33 2 -27.87 4.42 -6.30 0.000 15451.33 Temperatura*Temperatura*TipoVidrio 1 0.1124 0.0177 6.36 0.000 4354.00 2 0.1220 0.0177 6.91 0.000 4354.00
Resultados clave: Valor p, Coeficientes

En estos resultados, los efectos principales para el tipo de vidrio y la temperatura son estadísticamente significativos al nivel de significancia de 0.05. Se puede concluir que los cambios en estas variables están asociados con los cambios en la variable de respuesta.

De los tres tipos de vidrio en el experimento, el resultado muestra los coeficientes para dos tipos. Por opción predeterminada, Minitab elimina un nivel de factor para evitar la multicolinealidad perfecta. Puesto que el análisis utiliza el esquema de codificación −1, 0, +1, los coeficientes para los efectos principales representan la diferencia entre cada media de nivel y la media general. Por ejemplo, el tipo de vidrio 1 está asociado con la salida de luz que es 1323 unidades mayor que la media general.

La temperatura es una covariable en este modelo. El coeficiente para el efecto principal representa el cambio en la respuesta media para un incremento de una unidad en la covariable, en tanto que los otros términos en el modelo se mantienen constantes. Para cada incremento de un grado en la temperatura, la salida de luz media aumenta en 83.87 unidades.

Tanto el tipo de vidrio como la temperatura están incluidos en los términos de orden superior que son estadísticamente significativos.

Los términos de interacción de dos factores y de tres factores para el tipo de vidrio y la temperatura son estadísticamente significativos. Estas interacciones indican que la relación entre cada variable y la respuesta depende del valor de la otra variable. Por ejemplo, el efecto del tipo de vidrio sobre la salida de luz depende de la temperatura.

El término polinomial, Temperatura*Temperatura, indica que la curvatura en la relación entre temperatura y salida de luz es estadísticamente significativa.

No se deben interpretar los efectos principales sin considerar los efectos de interacción y curvatura. Para obtener un mejor conocimiento de los efectos principales, y de la curvatura en su modelo, vaya a Gráficos factoriales y Optimizador de respuestas.

Paso 2: Determinar hasta qué punto el modelo se ajusta a sus datos

Para determinar hasta que punto el modelo se ajusta a sus datos, examine los estadísticos de bondad de ajuste en la tabla Resumen del modelo.

S

Utilice S para evaluar hasta que punto el modelo describe la respuesta. Utilice S en lugar del estadístico R2 para comparar el ajuste de modelos que no tienen una constante

S se mide en las unidades de la variable de respuesta y representa la desviación estándar de hasta qué punto se separa a los valores de datos de los valores ajustados. Mientras más bajo sea el valor de S, mejor describirá la respuesta el modelo. Sin embargo, un bajo valor de S no indica, por sí mismo, que el modelo cumpla con los supuestos del modelo. Debe examinar las gráficas de residuos para verificar los supuestos.

R-cuad.

Mientras mayor sea el valor de R2, mejor se ajustará el modelo a sus datos. El R2 siempre se encuentra entre 0 y 100%.

El R2 siempre se incrementa cuando usted agrega predictores adicionales a un modelo. Por ejemplo, el mejor modelo de cinco predictores siempre tendrá un R2 que sea al menos tan alto como el mejor modelo de cuatro predictores. Por lo tanto, R2 es más útil cuando compara modelos del mismo tamaño.

R-cuad.(ajustado)

Utilice el R2 ajustado cuando desee comparar modelos que tengan diferentes números de predictores. El R2 siempre se incrementa cuando usted agrega un predictor al modelo, incluso cuando no haya una mejora real en el modelo. El valor de R2 ajustado incorpora el número de predictores del modelo para ayudarle a elegir el modelo correcto.

R-cuad.(pred)

Utilice el R2 pronosticado para determinar hasta que punto su modelo predice la respuesta para las nuevas observaciones. Los modelos que tienen valores de R2 pronosticados más grandes tienen un mejor capacidad de predicción.

Un R2 pronosticado que sea sustancialmente menor que el R2 puede indicar que el modelo está sobreajustado. Un modelo sobreajustado se produce cuando agrega términos por efectos que no estén en la población. El modelo se adapta a la medida de los datos de la muestra, por lo tanto, es posible que no sea útil para hacer predicciones acerca de la población.

El R2 pronosticado puede ser también más útil que el R2 ajustado para comparar modelos debido a que se calcula con observaciones que no están incluidas en el cálculo del modelo.

Considere los siguientes puntos cuando interprete los valores R2:
  • Las muestras pequeñas no proporcionan una estimación precisa de la resistencia de la relación entre la respuesta y los predictores. Si necesita que el R2 sea más preciso, debe utilizar una muestra más grande (generalmente, 40 o más).

  • El R2 es solo una medida de hasta qué punto el modelo se ajusta a los datos. Incluso cuando un modelo tiene un R2 alto,usted debe revisar las gráficas de residuos para verificar que el modelo cumpla con los supuestos del modelo.

Resumen del modelo R-cuad. R-cuad. S R-cuad. (ajustado) (pred) 19.1185 99.73% 99.61% 99.39%
Resultados clave: S, R-cuad., R-cuad.(ajust), R-cuad.(pred)

En estos resultados, el modelo explica un 99.73 % de la variación en la salida de luz de las muestras de la placa frontal de vidrio. Para estos datos, el valor de R2 indica el modelo que ofrece un mejor ajuste para los datos. Si se ajustan modelos adicionales con diferentes predictores, utilice los valores R2 ajustados y los valores R2 de predicción para comparar hasta que punto el modelo se ajusta a los datos.

Paso 3: Determinar si el modelo cumple con los supuestos del análisis

Utilice las gráficas de residuos como ayuda para determinar si el modelo es adecuado y cumple con los supuestos del análisis. Si los supuestos no se cumplen, el modelo podría no ajustarse adecuadamente a los datos y se debería tener cuidado al interpretar los resultados.

Para obtener más información sobre cómo manejar los patrones en las gráficas de residuos, vaya a Gráficas de residuos para Ajustar modelo lineal general y haga clic en el nombre de la gráfica de residuos en la lista que se encuentra en la parte superior de la página.

Gráfica de residuos vs. ajustes

Utilice la gráfica de residuos vs. ajustes para verificar el supuesto de que los residuos están distribuidos aleatoriamente y tienen una varianza constante. Lo ideal es que los puntos se ubiquen aleatoriamente a ambos lados del 0, con patrones no detectables en los puntos.

Los patrones que se observan en la siguiente tabla podrían indicar que el modelo no cumple con los supuestos del modelo.
Patrón Lo que podría indicar el patrón
Dispersión en abanico o irregular de los residuos en los valores ajustados Varianza no constante
Curvilíneo Un término de orden superior faltante
Un punto que está alejado de cero Un valor atípico
Un punto que está lejos de los otros puntos en la dirección x Un punto influyente
En esta gráfica de residuos vs. ajustes, los datos parecen estar distribuidos aleatoriamente alrededor de cero. No existe evidencia de que el valor del residuo dependa del valor ajustado.

Gráfica de residuos vs. orden

Utilice la gráfica de residuos vs. orden para verificar el supuesto de que los residuos son independientes entre sí. Los residuos independientes no muestran tendencias ni patrones cuando se muestran en orden cronológico. Los patrones en los puntos podrían indicar que los residuos que están cercanos entre sí podrían estar correlacionados y, por lo tanto, podrían no ser independientes. Lo ideal es que los residuos que se muestran en la gráfica se ubiquen aleatoriamente alrededor de la línea central:
Si observa un patrón, investigue la causa. Los siguientes tipos de patrones pueden indicar que los residuos son dependientes.
Tendencia
Cambio
Ciclo
En esta gráfica de residuos vs. orden, los residuos parecen estar ubicados aleatoriamente alrededor de la línea central. No hay evidencia de que los residuos no sean independientes.

Gráfica de probabilidad normal de los residuos

Utilice la gráfica de probabilidad normal de los residuos para verificar el supuesto de que los residuos están distribuidos normalmente. La gráfica de probabilidad normal de los residuos debe seguir aproximadamente una línea recta.

Los patrones que se observan en la siguiente tabla podrían indicar que el modelo no cumple con los supuestos del modelo.
Patrón Lo que podría indicar el patrón
No una línea recta No normalidad
Un punto que está alejado de la línea Un valor atípico
Pendiente cambiante Una variable no identificada
En esta gráfica de probabilidad normal, los puntos generalmente siguen una línea recta. No hay evidencia de no normalidad, valores atípicos o variables no identificadas.
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política