Tabla Resumen del modelo para Gráfica de línea ajustada

Encuentre definiciones e interpretaciones para cada uno de los estadísticos incluidos en la tabla Resumen del modelo.

S

S representa la desviación estándar de la distancia entre los valores de datos y los valores ajustados. S se mide en las unidades de la respuesta.

Interpretación

Utilice S para evaluar hasta que punto el modelo describe la respuesta. S se mide en las unidades de la variable de respuesta y representa la desviación estándar de hasta qué punto se separa a los valores de datos de los valores ajustados. Mientras más bajo sea el valor de S, mejor describirá la respuesta el modelo. Sin embargo, un bajo valor de S no indica, por sí mismo, que el modelo cumpla con los supuestos del modelo. Debe examinar las gráficas de residuos para verificar los supuestos.

Por ejemplo, usted trabaja para una compañía de chips de patatas que examina los factores que afectan el número de chips desmenuzados por contenedor. Usted reduce el modelo a los predictores significativos y determina que S se calcula como 1.79. Este resultado indica que la desviación estándar de los puntos de datos alrededor de los valores ajustados es 1.79. Si está comparando modelos, los valores que son menores de 1.79 indican un mejor ajuste y los valores mayores indican un peor ajuste.

R-cuad.

El R2 es el porcentaje de variación en la respuesta que es explicada por el modelo. Se calcula como 1 menos la relación del error de la suma de cuadrados (que es la variación que no está explicada por el modelo) con la suma total de cuadrados (que es la variación total en el modelo).

Interpretación

Utilice R2 para determinar hasta qué punto el modelo se ajusta a sus datos. Mientras mayor sea el valor de R2, mejor se ajustará el modelo a sus datos. El R2 siempre se encuentra entre 0 y 100%.

Puede utilizar una gráfica de línea ajustada para ilustrar gráficamente valore de R2 diferentes. La primera gráfica ilustra un modelo de regresión simple que explica un 85.5 % de la variación en la respuesta. La segunda gráfica ilustra un modelo que explica un 22.6 % de la variación en la respuesta. Mientras mayor sea la variable que es explicada por el modelo, más cerca estarán los puntos de los datos a la línea de regresión ajustada. Teóricamente, si un modelo pudiera explicar el 100 % de la variación, los valores ajustados siempre serían iguales a los valores observados y todos los puntos de los datos se encontrarían sobre la línea de regresión ajustada. Sin embargo, incluso si R2 es 100 %, el modelo no necesariamente predice nuevas observaciones bien.
Considere los siguientes problemas cuando interprete el valor R2:
  • El R2 siempre se incrementa cuando usted agrega predictores adicionales a un modelo. Por ejemplo, el mejor modelo de cinco predictores siempre tendrá un R2 que sea al menos tan alto como el mejor modelo de cuatro predictores. Por lo tanto, R2 es más útil cuando compara modelos del mismo tamaño.

  • Las muestras pequeñas no proporcionan una estimación precisa de la resistencia de la relación entre la respuesta y los predictores. Si necesita que el R2 sea más preciso, debe utilizar una muestra más grande (generalmente, 40 o más).

  • El R2 es solo una medida de hasta qué punto el modelo se ajusta a los datos. Incluso cuando un modelo tiene un R2 alto,usted debe revisar las gráficas de residuos para verificar que el modelo cumpla con los supuestos del modelo.

R-cuad.(ajustado)

El R2 ajustado es el porcentaje de la variación en la respuesta que es explicada por el modelo, ajustado para el número de predictores en el modelo relativo al número de observaciones. El R2 ajustado se calcula como 1 menos la relación del cuadrado medio del error (MSE) con el cuadrado medio total (CM Total).

Interpretación

Utilice el R2 ajustado cuando desee comparar modelos que tengan diferentes números de predictores. El R2 siempre se incrementa cuando usted agrega un predictor al modelo, incluso cuando no haya una mejora real en el modelo. El valor de R2 ajustado incorpora el número de predictores del modelo para ayudarle a elegir el modelo correcto.

Por ejemplo, usted trabaja para una compañía de chips de patatas que examina los factores que afectan el número de chips desmenuzados por contenedor. Obtiene los siguientes resultados a medida que agrega los predictores de forma escalonada hacia delante:
Modelo % Patata Tasa de enfriamiento Temp. de cocción R2 R2 ajustado
1 X     52 % 51 %
2 X X   63 % 62 %
3 X X X 65 % 62 %

El primer modelo produce un R2 de más de 50 %. El segundo modelo agrega una tasa de enfriamiento al modelo. El R2 ajustado se incrementa, lo cual indica que la tasa de enfriamiento mejora el modelo. El tercer modelo, que agrega un temperatura de cocción, aumenta el R2 pero no el R2 ajustado. Estos resultados indican que la temperatura de cocción no mejora el modelo. Con base en estos resultados, considere eliminar la temperatura de cocción del modelo.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política