En la regresión de los mejores subconjuntos, Minitab selecciona los dos modelos con los valores más altos de R2 que contienen un predictor, dos predictores y así sucesivamente. Se puede determinar qué predictores están incluidos en cada modelo con base en las columnas de la tabla de salida que están marcadas con una "X".
Utilice los estadísticos de bondad de ajuste para determinar el modelo que proporciona el mejor ajuste a los datos. Antes de seleccionar un modelo final, debe examinar las gráficas de residuos y otras medidas de diagnóstico para asegurarse de que el modelo cumpla con los supuestos del análisis.
Mientras mayor sea el valor de R2, mejor se ajustará el modelo a los datos. R2 siempre está entre 0% y 100%.
El R2 siempre se incrementa cuando usted agrega predictores adicionales a un modelo. Por ejemplo, el mejor modelo de cinco predictores siempre tendrá un R2 que será al menos tan alto como el mejor modelo de cuatro predictores. Por lo tanto, R2 es más útil cuando se comparan modelos del mismo tamaño.
Utilice R2 ajustado cuando desee comparar modelos que tengan diferentes números de predictores. R2 siempre aumenta cuando se agrega un predictor al modelo, incluso cuando no haya una mejora real en el modelo. El valor de R2 ajustado incorpora el número de predictores del modelo para ayudar a elegir el modelo correcto.
Utilice R2 pronosticado para determinar qué tan bien el modelo predice la respuesta para nuevas observaciones.Los modelos que tienen valores más grandes de R2 pronosticado tienen mejor capacidad de predicción.
Un R2 pronosticado que sea sustancialmente menor que R2 puede indicar que el modelo está sobreajustado. Un modelo sobreajustado se produce cuando se agregan términos para efectos que no son importantes en la población. El modelo se adapta a los datos de la muestra y, por lo tanto, es posible que no sea útil para hacer predicciones acerca de la población.
El R2 pronosticado también puede ser más útil que el R2 ajustado para comparar modelos, porque se calcula con observaciones que no se incluyen en el cálculo del modelo.
Utilice S para evaluar qué tan bien el modelo describe la respuesta. Utilice S en lugar de los estadísticos R2 para comparar el ajuste de los modelos que no tienen una constante.
S se mide en las unidades de la variable de respuesta y representa la distancia que separa a los valores de los datos de los valores ajustados. Mientras más bajo sea el valor de S, mejor describirá el modelo la respuesta. Sin embargo, un valor de S bajo no indica por sí solo que el modelo cumple con los supuestos del modelo. Debe examinar las gráficas de residuos para verificar los supuestos.
Las muestras pequeñas no proporcionan una estimación precisa de la fuerza de la relación entre la respuesta y los predictores. Por ejemplo, si necesita que R2 sea más preciso, debe utilizar una muestra más grande (generalmente, 40 o más).
Los estadísticos de bondad de ajuste son simplemente una medida de qué tan bien se ajusta el modelo a los datos. Incluso cuando un modelo tenga un valor deseable, usted deberá revisar las gráficas de residuos para verificar que el modelo cumpla con los supuestos del modelo.
Vars | R-cuadrado | R-cuadrado (ajust) | R-cuadrado (pred.) | Cp de Mallows | S | I n s o l a c i ó n | E s t e | S u r | N o r t e | H o r a d e l d í a |
---|---|---|---|---|---|---|---|---|---|---|
1 | 72.1 | 71.0 | 66.9 | 38.5 | 12.328 | X | ||||
1 | 39.4 | 37.1 | 26.3 | 112.7 | 18.154 | X | ||||
2 | 85.9 | 84.8 | 81.4 | 9.1 | 8.9321 | X | X | |||
2 | 82.0 | 80.6 | 74.2 | 17.8 | 10.076 | X | X | |||
3 | 87.4 | 85.9 | 79.0 | 7.6 | 8.5978 | X | X | X | ||
3 | 86.5 | 84.9 | 81.4 | 9.7 | 8.9110 | X | X | X | ||
4 | 89.1 | 87.3 | 80.6 | 5.8 | 8.1698 | X | X | X | X | |
4 | 88.0 | 86.0 | 79.3 | 8.2 | 8.5550 | X | X | X | X | |
5 | 89.9 | 87.7 | 78.8 | 6.0 | 8.0390 | X | X | X | X | X |
En estos resultados, hay varios modelos que se deben examinar más a fondo. El modelo con los 5 predictores tiene el valor más bajo de S y el valor más alto de R2 ajustado, aproximadamente 8 y 88, respectivamente. Un modelo con 2 predictores y un modelo con 3 predictores tienen los mayores valores de R2 pronosticado: 81.4%. Antes de seleccionar el modelo final, debe examinar los modelos para detectar violaciones de los supuestos de regresión utilizando gráficas de residuos y otras medidas de diagnóstico.