Crear una gráfica de línea ajustada y un modelo de regresión que pasen por el origen

En este tema

Crear una gráfica de línea ajustada que pase por el origen
Crear un modelo de regresión que pase por el origen

De manera predeterminada, Minitab incluye un término constante para las gráficas de línea ajustada y los modelos de regresión. Para eliminar este término y que el modelo pase por el origen, siga estos pasos.

Crear una gráfica de línea ajustada que pase por el origen

Supongamos que la variable predictora (X) está en C1 y la variable de respuesta (Y) está en C2.

Elija Gráfica > Gráfica de dispersión > Con regresión.
En variables Y, ingrese C2. En variables X, ingrese C1.
Haga clic en Mostrar datos y luego en la ficha Regresión.
Desmarque Ajustar intersección. Haga clic en Aceptar en cada cuadro de diálogo.

Crear un modelo de regresión que pase por el origen

Supongamos que la variable predictora (X) está en C1 y la variable de respuesta (Y) está en C2.

Elija Estadísticas > Regresión > Regresión > Ajustar modelo de regresión.
En Respuestas, ingrese C2. En Predictores continuos, ingrese C1.
Haga clic en Modelo y desmarque Incluir el término de constante en modelo.
Haga clic en Aceptar en cada cuadro de diálogo.

Cuando Minitab ajusta el modelo con el término constante, el R-cuadrado es la proporción de la variación inicial, medida por la suma de los cuadrados alrededor de la media de Y, que es explicada por la regresión. Para el modelo sin el término constante, el R-cuadrado es la proporción de la variación alrededor del origen (es decir, alrededor del valor cero) explicada por la regresión. Esto significa que los valores de R-cuadrado para los modelos con intersección y sin intersección no son similares.

Específicamente, el R-cuadrado para la regresión a través del origen tiende a ser mayor que el R-cuadrado para la regresión con una intersección, incluso si la calidad del ajuste no es mejor. El modelo con intersección calcula que las variaciones en el numerador (Ssreg) y el denominador (Sstotal) de R-cuadrado se calculan alrededor de la media de respuesta, mientras que en el modelo sin intersección, esas variaciones se calculan alrededor de cero. Estos estadísticos no pueden utilizarse para la comparación del desempeño con el modelo con intersección, porque el R-cuadrado del modelo sin intercepción tiende a ser mayor que el R-cuadrado del modelo con intercepción. Esto se debe a que se utilizan sumas de los cuadrados (alrededor de cero) sin corrección. Si el R-cuadrado se calcula alrededor de la media de respuesta en el modelo sin intersección, a veces puede ser negativo.