Interpretar los resultados clave para Regresión de mejores subconjuntos

En la regresión de los mejores subconjuntos, Minitab selecciona los dos modelos con los valores más altos de R2 que contienen un predictor, dos predictores y así sucesivamente. Se puede determinar qué predictores están incluidos en cada modelo con base en las columnas de la tabla de salida que están marcadas con una "X".

Utilice los estadísticos de bondad de ajuste para determinar el modelo que proporciona el mejor ajuste a los datos. Antes de seleccionar un modelo final, debe examinar las gráficas de residuos y otras medidas de diagnóstico para asegurarse de que el modelo cumpla con los supuestos del análisis.

R-cuad.

Mientras mayor sea el valor de R2, mejor se ajustará el modelo a sus datos. El R2 siempre se encuentra entre 0 y 100%.

El R2 siempre se incrementa cuando usted agrega predictores adicionales a un modelo. Por ejemplo, el mejor modelo de cinco predictores siempre tendrá un R2 que sea al menos tan alto como el mejor modelo de cuatro predictores. Por lo tanto, R2 es más útil cuando compara modelos del mismo tamaño.

R-cuad.(ajust)

Utilice el R2 ajustado cuando desee comparar modelos que tengan diferentes números de predictores. El R2 siempre se incrementa cuando usted agrega un predictor al modelo, incluso cuando no haya una mejora real en el modelo. El valor de R2 ajustado incorpora el número de predictores del modelo para ayudarle a elegir el modelo correcto.

R-cuad.(pred)

Utilice el R2 pronosticado para determinar hasta que punto su modelo predice la respuesta para las nuevas observaciones. Los modelos que tienen valores de R2 pronosticados más grandes tienen un mejor capacidad de predicción.

Un R2 pronosticado que sea sustancialmente menor que el R2 puede indicar que el modelo está sobreajustado. Un modelo sobreajustado se produce cuando agrega términos por efectos que no estén en la población. El modelo se adapta a la medida de los datos de la muestra, por lo tanto, es posible que no sea útil para hacer predicciones acerca de la población.

El R2 pronosticado puede ser también más útil que el R2 ajustado para comparar modelos debido a que se calcula con observaciones que no están incluidas en el cálculo del modelo.

Cp de Mallows
El Cp de Mallows compara la precisión y el sesgo del modelo completo con los de los modelos que tienen los mejores subconjuntos de predictores. Un valor del Cp de Mallows que está cerca del número de predictores más la constante indica que el modelo produce estimaciones relativamente precisas y no sesgadas.
S

Utilice S para evaluar hasta que punto el modelo describe la respuesta. Utilice S en lugar del estadístico R2 para comparar el ajuste de modelos que no tienen una constante

S se mide en las unidades de la variable de respuesta y representa la desviación estándar de hasta qué punto se separa a los valores de datos de los valores ajustados. Mientras más bajo sea el valor de S, mejor describirá la respuesta el modelo. Sin embargo, un bajo valor de S no indica, por sí mismo, que el modelo cumpla con los supuestos del modelo. Debe examinar las gráficas de residuos para verificar los supuestos.

Considere los siguientes puntos cuando interprete los valores de R2:
  • Las muestras pequeñas no proporcionan una estimación precisa de la resistencia de la relación entre la respuesta y los predictores. Si necesita que el R2 sea más preciso, debe utilizar una muestra más grande (generalmente, 40 o más).

  • El R2 es solo una medida de hasta qué punto el modelo se ajusta a los datos. Incluso cuando un modelo tiene un R2 alto,usted debe revisar las gráficas de residuos para verificar que el modelo cumpla con los supuestos del modelo.

Regresión de los mejores subconjuntos: FlujoCalor vs. Insolación, Este, ...

la respuesta es FlujoCalor H o I r n a s o d l e a N l c E o i s S r d R-cuad. R-cuad. Cp de ó t u t í Vars R-cuad. (ajust) (pred.) Mallows S n e r e a 1 72.1 71.0 66.9 38.5 12.328 X 1 39.4 37.1 26.3 112.7 18.154 X 2 85.9 84.8 81.4 9.1 8.9321 X X 2 82.0 80.6 74.2 17.8 10.076 X X 3 87.4 85.9 79.0 7.6 8.5978 X X X 3 86.5 84.9 81.4 9.7 8.9110 X X X 4 89.1 87.3 80.6 5.8 8.1698 X X X X 4 88.0 86.0 79.3 8.2 8.5550 X X X X 5 89.9 87.7 78.8 6.0 8.0390 X X X X X
Resultados clave: R-cuad., R-cuad.(ajust), R-cuad.(pred), Cp de Mallows, S

En estos resultados, hay varios modelos que se deben examinar más a fondo. El modelo con los 5 predictores tiene el valor más bajo de S y el valor más alto de R2 ajustado, aproximadamente 8 y 88, respectivamente. Un modelo con 2 predictores y un modelo con 3 predictores tienen los mayores valores de R2 pronosticado: 81.4%. Antes de seleccionar el modelo final, debe examinar los modelos para detectar violaciones de los supuestos de regresión utilizando gráficas de residuos y otras medidas de diagnóstico.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política