La gráfica con la línea ajustada muestra la respuesta y los datos de los predictores. La gráfica incluye la línea de regresión, que representa la ecuación de regresión. Usted también puede elegir mostrar los intervalos de confianza y de predicción de 95% en la gráfica.
Utilice la ecuación de regresión para describir la relación entre la respuesta y los términos en el modelo. La ecuación de regresión es una representación algebraica de la línea de regresión. La ecuación de regresión para el modelo lineal tiene la forma siguiente: Y= b0 + b1x1. En la ecuación de regresión, Y es la variable de respuesta, b0 es la constante o intersección, b1 es el coeficiente estimado para el término lineal (también denominado como pendiente de línea) y x1 es el valor del término.
La ecuación de regresión con más de término tiene la forma siguiente:
y = b0 + b1X1 + b2X2 + ... + bkXk
Un coeficiente de regresión describe el tamaño de la relación entre un predictor y la variable de respuesta. Los coeficientes son los números por los cuales se multiplican los valores del término en una ecuación de regresión.
El coeficiente del término representa el cambio en la respuesta media para un cambio de una unidad en ese término. El signo del coeficiente indica la dirección de la relación entre el término y la respuesta. Si el coeficiente es negativo, a medida que el término aumenta, el valor medio de la respuesta disminuye. Si el coeficiente es positivo, a medida que el término aumenta, el valor medio de la respuesta se incrementa.
Por ejemplo, un gerente determina que la puntuación de un empleado en una prueba de aptitudes laborales se puede predecir utilizando el modelo de regresión, y = 130 + 4.3x. En la ecuación, x se refiere a las horas de capacitación en el hogar (de 0 a 20) y Y es la puntuación de la prueba. El coeficiente o pendiente es de 4.3, lo cual indica que por cada hora de capacitación la puntuación media de la prueba aumenta en 4.3 puntos.
El tamaño del coeficiente generalmente es una buena forma de evaluar la significancia práctica del efecto que un término tiene sobre la variable de respuesta. Sin embargo, el tamaño del coeficiente no indica si un término es estadísticamente significativo porque los cálculos de significancia también consideran la variación en los datos de respuesta. Para determinar la significancia estadística, examine el valor p del término.
El intervalo de confianza para el ajuste proporciona un rango de valores probables para la respuesta media dada la configuración especificada de los predictores.
Utilice el intervalo de confianza para evaluar la estimación del valor ajustado para los valores observados de las variables.
Por ejemplo, con un nivel de confianza de 95%, usted puede estar 95% seguro de que el intervalo de confianza contiene la media de la población para los valores especificados de las variables incluidas en el modelo. El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Un intervalo de confianza amplio indica que usted puede estar menos seguro acerca de la media de los valores futuros. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra.
El intervalo de predicción es un rango que es probable que contenga una respuesta futura individual para un valor de la variable predictora.
Con bandas de predicción de 95%, usted puede estar 95% seguro de que las nuevas observaciones estarán dentro del intervalo indicado por las líneas púrpura. (Sin embargo, tenga en cuenta que esto solo será válido para los valores de densidad que estén dentro del rango incluido en el análisis.)
Por ejemplo, un ingeniero de materiales que trabaja en una fábrica de muebles desarrolla un modelo de regresión simple para predecir la rigidez del tablero de partículas a partir de la densidad del tablero. El ingeniero verifica que el modelo cumple con los supuestos del análisis. Luego, el analista utiliza el modelo para predecir la rigidez.
La ecuación de regresión predice que la rigidez para una nueva observación con una densidad de 20 es 12.70 – 1.517*20 + 0.1622*202, es decir, 47.24. Aunque es poco probable que dicha observación tenga exactamente una rigidez de 47.24, el intervalo de predicción indica que el ingeniero puede estar 95% seguro de que el valor real estará aproximadamente entre 31 y 63.
El intervalo de predicción siempre es más amplio que el intervalo de confianza correspondiente. En este ejemplo, el intervalo de confianza de 95% indica que el ingeniero puede estar 95% seguro de que la rigidez media estará entre aproximadamente 43 y 50.