Interpretar los resultados clave para Gráfica de línea ajustada

Complete los siguientes pasos para interpretar una gráfica de línea ajustada. La salida clave incluye el valor p, la gráfica de línea ajustada, el R2 y la gráfica de residuos.

Paso 1: Determinar si la asociación entre la respuesta y el término es estadísticamente significativa

Para determinar si la asociación entre la respuesta y cada término en el modelo es estadísticamente significativa, compare el valor p del término con su nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que el coeficiente del término es igual a cero, lo que indica que no hay asociación entre el término y la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0,05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el término. Si ajusta un modelo cuadrático o cúbico y los términos cuadráticos o cúbicos son significativos, puede concluir que los datos contienen curvatura.
Valor p > α: La asociación no es estadísticamente significativa

Si el valor p es mayor que el nivel de significancia, usted no puede concluir que existe una asociación estadísticamente significativa entre la variable de respuesta y el término. Si ajusta un modelo cuadrático o cúbico y los términos cuadráticos o cúbicos no son estadísticamente significativos, convendría que seleccione un modelo diferente.

Análisis de Varianza

FuenteGLSCMCFP
Regresión212189.46094.70106.540.000
Error261487.357.21   
Total2813676.7     

Análisis de varianza secuencial

FuenteGLSCFP
Lineal111552.8146.860.000
Cuadrático1636.611.130.003
Resultado clave: Valor p

En estos resultados, el valor p para el término lineal, Densidad, es 0.000 y para el término cuadrático, Densidad2, es 0.003. Ambos valores son menores que el nivel de significancia de 0.05. Estos resultados indican que la asociación entre la rigidez y la densidad es estadísticamente significativa.

Paso 2: Determinar si la línea de regresión se ajusta a los datos

Evalúe hasta qué punto el modelo se ajusta a los datos y si el modelo cumple sus metas. Examine la gráfica de línea ajustada para determinar si se cumplen los siguientes criterios:
  • La muestra contiene un número adecuado de observaciones a lo largo del rango completo de todos los valores de los predictores.
  • El modelo se ajusta adecuadamente a cualquier curvatura en los datos. Si ajusta un modelo lineal y observa una curvatura en los datos, repita el análisis y seleccione el modelo cuadrático o cúbico. Para determinar cuál modelo es mejor, examine la gráfica y los estadísticos de bondad de ajuste. Revise el valor p de los términos en el modelo para asegurarse de que son estadísticamente significativos y aplique el conocimiento del proceso para evaluar la significancia práctica.
  • Busque cualquier valor atípico, que pueda tener un efecto fuerte sobre los resultados. Intente identificar la causa de cualesquiera valores atípicos. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos que estén asociados con eventos anormales y únicos (causas especiales). Luego, repita el análisis. Para obtener más información sobre cómo detectar valores atípicos, vaya a Observaciones poco comunes.
En esta gráfica de línea ajustada, los puntos generalmente siguen la línea de regresión. Los puntos cubren adecuadamente todo el rango de valores de densidad. Sin embargo, el punto situado en la esquina superior derecha de la gráfica parece ser un valor atípico. Investigue ese punto para determinar su causa.

Paso 3: Examinar cómo está asociado el término con la respuesta

Si el valor p del término es significativo, usted puede examinar la ecuación de regresión y los coeficientes para entender cómo se relaciona el término con la respuesta.

Utilice la ecuación de regresión para describir la relación entre la respuesta y los términos incluidos en el modelo. La ecuación de regresión es una representación algebraica de la línea de regresión. La ecuación de regresión para el modelo lineal tiene la forma siguiente: Y= b0 + b1x1. En la ecuación de regresión, Y es la variable de respuesta, b0 es la constante o intersección, b1 es el coeficiente estimado para el término lineal (también conocido como la pendiente de la línea) y x1 es el valor del término.

El coeficiente del término representa el cambio en la respuesta media para un cambio de una unidad en ese término. El signo del coeficiente indica la dirección de la relación entre el término y la respuesta. Si el coeficiente es negativo, a medida que el término aumenta, el valor medio de la respuesta disminuye. Si el coeficiente es positivo, a medida que el término aumenta, el valor medio de la respuesta se incrementa.

Por ejemplo, un gerente determina que la puntuación de un empleado en una prueba de aptitudes laborales se puede predecir utilizando el modelo de regresión, y = 130 + 4.3x. En la ecuación, x se refiere a las horas de capacitación en el hogar (de 0 a 20) y Y es la puntuación de la prueba. El coeficiente o pendiente es de 4.3, lo cual indica que por cada hora de capacitación la puntuación media de la prueba aumenta en 4.3 puntos.

Para obtener más información sobre los coeficientes, vaya a Coeficientes de regresión.

La ecuación de regresión es
Rigidez = 12.70 - 1.517 Densidad + 0.1622 Densidad^2

Resumen del modelo

SR-cuadradoR-cuadrado(ajustado)
7.5634289.13%88.29%
Resultados clave: Ecuación de regresión, coeficiente

El coeficiente del predictor, Densidad, es –1.517 y para Densidad2, el coeficiente es 0.1622. Por lo tanto, con una relación cuadrática, la rigidez promedio del tablero placa de partículas aumenta más rápidamente con valores de densidad más grandes que con valores de densidad más pequeños.

Paso 4: Determinar qué tan bien se ajusta el modelo a los datos

Para determinar qué tan bien se ajusta el modelo a los datos, examine los estadísticos de bondad de ajuste en la tabla Resumen del modelo.

R-cuad.

El R2 es el porcentaje de variación en la respuesta que es explicado por el modelo.Cuanto mayor es el valor de R2, mejor se ajusta el modelo a los datos .El R2 siempre está entre 0% y 100%.

El R2 siempre aumenta cuando se agregan más predictores a un modelo. Por ejemplo, el mejor modelo de cinco predictores siempre tendrá un R2 que será al menos tan alto como el del mejor modelo de cuatro predictores. Por lo tanto, el R2 es más útil cuando se comparan modelos del mismo tamaño.

R-cuad. (ajust)

Utilice el R2 ajustado cuando desee comparar modelos que tengan diferentes números de predictores. El R2 siempre aumenta cuando se agrega un predictor al modelo, incluso cuando no haya una mejora real en el modelo. El valor de R2 ajustado incorpora el número de predictores del modelo para ayudar a elegir el modelo correcto.

Considere lo siguiente cuando compare los valores de R2:
  • Las muestras pequeñas no proporcionan una estimación precisa de la fuerza de la relación entre la respuesta y los predictores. Por ejemplo, si necesita que el R2 sea más preciso, debe utilizar una muestra más grande (generalmente, 40 o más).

  • Los estadísticos de bondad de ajuste son simplemente una medida de qué tan bien se ajusta el modelo a los datos. Incluso cuando un modelo tenga un valor deseable, usted deberá revisar las gráficas de residuos para verificar que el modelo cumpla con los supuestos del modelo.

La ecuación de regresión es
Rigidez = 12.70 - 1.517 Densidad + 0.1622 Densidad^2

Resumen del modelo

SR-cuadradoR-cuadrado(ajustado)
7.5634289.13%88.29%
Resultado clave: R-cuad.

En estos resultados, la densidad del tablero de partículas explica aproximadamente el 89% de la variación en la rigidez de los tableros. El valor de R2 indica que el modelo se ajusta adecuadamente a los datos.

Paso 5: Determinar si el modelo cumple con los supuestos del análisis

Utilice las gráficas de residuos como ayuda para determinar si el modelo es adecuado y cumple con los supuestos del análisis. Si los supuestos no se cumplen, el modelo podría no ajustarse a los datos adecuadamente y se debería tener cuidado al interpretar los resultados.

Gráfica de residuos vs. ajustes

Utilice la gráfica de residuos vs. ajustes para comprobar el supuesto de que los residuos están distribuidos aleatoriamente y tienen una varianza constante. Lo ideal sería que los puntos estuvieran ubicados de manera aleatoria a ambos lados de 0, sin patrones reconocibles en los puntos.

Los patrones de la tabla siguiente pueden indicar que el modelo no cumple con los supuestos del modelo.
Patrón Lo que el patrón puede indicar
Dispersión en abanico o irregular de los residuos en los valores ajustados Varianza no constante
Curvilíneo Un término de orden superior faltante
Un punto que está alejado de cero Un valor atípico
Un punto que está lejos de los otros puntos en la dirección x Un punto influyente
En esta gráfica de residuos vs. ajustes, los puntos aparecen dispersos de forma aleatoria. Sin embargo, el punto en la esquina superior derecha parece ser un valor atípico. Trate de identificar la causa del valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos que estén asociados con eventos anormales y únicos (causas especiales). Luego, repita el análisis.

Gráfica de residuos vs. orden

Utilice la gráfica de residuos vs. orden para verificar el supuesto de que los residuos son independientes entre sí. Los residuos independientes no muestran tendencias ni patrones cuando se muestran en orden cronológico. Los patrones en los puntos podrían indicar que los residuos cercanos entre sí podrían estar correlacionados y, por lo tanto, no son independientes. Lo ideal es que los residuos representados en la gráfica se ubiquen aleatoriamente alrededor de la línea central:
Si observa un patrón, investigue la causa. Los siguientes tipos de patrones pueden indicar que los residuos son dependientes.
Tendencia
Turno
Ciclo
En esta gráfica de residuos vs. orden, los puntos parecen estar ubicados aleatoriamente alrededor de la línea central. Los puntos que corresponden a las observaciones de las filas 15, 21 y 23 de la hoja de trabajo tienen residuos más grandes.

Gráfica de probabilidad normal

Utilice la gráfica de probabilidad normal de los residuos para comprobar el supuesto de que los residuos están distribuidos normalmente. La gráfica de probabilidad normal de los residuos debe seguir aproximadamente una línea recta.

Los patrones de la tabla siguiente pueden indicar que el modelo no cumple con los supuestos del modelo.
Patrón Lo que el patrón puede indicar
No una línea recta No normalidad
Un punto que está alejado de la línea Un valor atípico
Cambio en la pendiente Una variable no identificada
En esta gráfica de probabilidad normal, los residuos se desvían ligeramente de la línea recta. Sin embargo, cuando los datos contienen al menos 15 puntos, la normalidad no suele ser un problema para un cálculo fiable del valor p.

Para obtener más información sobre cómo manejar los patrones en las gráficas de residuos, vaya a Gráficas de residuos para Gráfica de línea ajustada.