Interpretar los resultados clave para Regresión de mejores subconjuntos

En la regresión de los mejores subconjuntos, Minitab selecciona los dos modelos con los valores más altos de R2 que contienen un predictor, dos predictores y así sucesivamente. Se puede determinar qué predictores están incluidos en cada modelo con base en las columnas de la tabla de salida que están marcadas con una "X".

Utilice los estadísticos de bondad de ajuste para determinar el modelo que proporciona el mejor ajuste a los datos. Antes de seleccionar un modelo final, debe examinar las gráficas de residuos y otras medidas de diagnóstico para asegurarse de que el modelo cumpla con los supuestos del análisis.

R-cuad.

Mientras mayor sea el valor de R2, mejor se ajustará el modelo a los datos. El R2 siempre está entre 0% y 100%.

El R2 siempre se incrementa cuando usted agrega predictores adicionales a un modelo. Por ejemplo, el mejor modelo de cinco predictores siempre tendrá un R2 que será al menos tan alto como el mejor modelo de cuatro predictores. Por lo tanto, el R2 es más útil cuando se comparan modelos del mismo tamaño.

R-cuad.(ajust)

Utilice el R2 ajustado cuando desee comparar modelos que tengan diferentes números de predictores. El R2 siempre aumenta cuando se agrega un predictor al modelo, incluso cuando no haya una mejora real en el modelo. El valor de R2 ajustado incorpora el número de predictores del modelo para ayudar a elegir el modelo correcto.

R-cuad.(pred)

Utilice el R2 pronosticado para determinar qué tan bien el modelo predice la respuesta para nuevas observaciones. Los modelos que tienen valores más grandes de R2 pronosticado tienen mejor capacidad de predicción.

Un R2 pronosticado que sea sustancialmente menor que el R2 puede indicar que el modelo está sobreajustado. Un modelo sobreajustado se produce cuando se agregan términos para efectos que no son importantes en la población. El modelo se adapta a los datos de la muestra y, por lo tanto, es posible que no sea útil para hacer predicciones acerca de la población.

El R2 pronosticado también puede ser más útil que el R2 ajustado para comparar modelos, porque se calcula con observaciones que no se incluyen en el cálculo del modelo.

Cp de Mallows
El Cp de Mallows compara la precisión y el sesgo del modelo completo con los de los modelos que tienen los mejores subconjuntos de predictores. Un valor del Cp de Mallows que está cerca del número de predictores más la constante indica que el modelo produce estimaciones relativamente precisas y no sesgadas.
S

Utilice S para evaluar qué tan bien el modelo describe la respuesta. Utilice S en lugar de los estadísticos R2 para comparar el ajuste de los modelos que no tienen una constante.

S se mide en las unidades de la variable de respuesta y representa la distancia que separa a los valores de los datos de los valores ajustados. Mientras más bajo sea el valor de S, mejor será descrita la respuesta por el modelo. Sin embargo, un valor de S bajo no indica por sí solo que el modelo cumple con los supuestos del modelo. Debe examinar las gráficas de residuos para verificar los supuestos.

Considere los siguientes puntos cuando interprete los valores de R2:
  • Las muestras pequeñas no proporcionan una estimación precisa de la fuerza de la relación entre la respuesta y los predictores. Si necesita que el R2 sea más preciso, debe utilizar una muestra más grande (generalmente, 40 o más).

  • El R2 es solo una medida de qué tan bien el modelo se ajusta a los datos. Incluso cuando un modelo tenga un R2 alto, usted deberá revisar las gráficas de residuos para verificar que el modelo cumpla con los supuestos del modelo.

Regresión de los mejores subconjuntos: FlujoCalor vs. Insolación, Este, ...

la respuesta es FlujoCalor H o I r n a s o d l e a N l c E o i s S r d R-cuad. R-cuad. Cp de ó t u t í Vars R-cuad. (ajust) (pred.) Mallows S n e r e a 1 72.1 71.0 66.9 38.5 12.328 X 1 39.4 37.1 26.3 112.7 18.154 X 2 85.9 84.8 81.4 9.1 8.9321 X X 2 82.0 80.6 74.2 17.8 10.076 X X 3 87.4 85.9 79.0 7.6 8.5978 X X X 3 86.5 84.9 81.4 9.7 8.9110 X X X 4 89.1 87.3 80.6 5.8 8.1698 X X X X 4 88.0 86.0 79.3 8.2 8.5550 X X X X 5 89.9 87.7 78.8 6.0 8.0390 X X X X X
Resultados clave: R-cuad., R-cuad.(ajust), R-cuad.(pred), Cp de Mallows, S

En estos resultados, hay varios modelos que se deben examinar más a fondo. El modelo con los 5 predictores tiene el valor más bajo de S y el valor más alto de R2 ajustado, aproximadamente 8 y 88, respectivamente. Un modelo con 2 predictores y un modelo con 3 predictores tienen los mayores valores de R2 pronosticado: 81.4%. Antes de seleccionar el modelo final, debe examinar los modelos para detectar violaciones de los supuestos de regresión utilizando gráficas de residuos y otras medidas de diagnóstico.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política