El R2 de desviación por lo general es considerado la proporción de la desviación total en la variable de respuesta que el modelo explica.
Mientras más alta sea la desviación R2, mejor se ajustará el modelo a los datos. La desviación de R2 siempre se encuentra entre 0% y 100%.
El R2 de desviación siempre se incrementa cuando usted agrega términos adicionales a un modelo. Por ejemplo, el mejor modelo de 5 términos siempre tendrá un R2 que sea al menos tan alto como el mejor modelo de 4 modelos. Por lo tanto, el R2 de desviación es más útil cuando se comparan modelos del mismo tamaño.
Los estadísticos de bondad de ajuste son simplemente una medida de qué tan bien se ajusta el modelo a los datos. Incluso cuando un modelo tenga un valor deseable, usted deberá revisar las gráficas de residuos y las pruebas de bondad de ajuste para evaluar qué tan bien se ajusta un modelo a los datos.
Puede utilizar una gráfica de línea ajustada para ilustrar gráficamente diferentes valores del R2 de desviación. La primera gráfica ilustra un modelo que explica aproximadamente 96% de la desviación en la respuesta. La segunda gráfica ilustra un modelo que explica aproximadamente 60% de la desviación en la respuesta. Mientras mayor sea la desviación explicada por un modelo, más cerca de la curva estarán los puntos de los datos. Teóricamente, si un modelo pudiera explicar el 100% de la desviación, los valores ajustados siempre serían iguales a los valores observados y todos los puntos de los datos estarían sobre la curva.
La organización de los datos afecta el valor de R2 de desviación. El R2 de desviación suele ser más alto para datos con múltiples pruebas por fila que para datos con una sola prueba por fila. Los valores de R2 de desviación son comparables solamente entre modelos que utilizan el mismo formato de datos. Para obtener más información, vaya a Cómo los formatos de datos afectan la bondad de ajuste en regresión logística binaria.
La desviación ajustada de R2 es la proporción de desviación en la respuesta que es explicada por el modelo, ajustado para el número de predictores en el modelo relativo al número de observaciones.
Utilice el R2 de desviación ajustado para comparar modelos que tengan diferentes números de términos. El R2 de desviación siempre se incrementa cuando usted agrega un término al modelo. El valor ajustado de R2 de desviación incorpora el número de términos en el modelo como ayuda para elegir el modelo correcto.
Paso | % Patata | Tasa de enfriamiento | Temp. de cocción | R2 de desviación | R2 de desviación ajustado | Valor p |
---|---|---|---|---|---|---|
1 | X | 52% | 51% | 0.000 | ||
1 | X | X | 63% | 62% | 0.000 | |
3 | X | X | X | 65 | 62 | 0.000 |
El primer paso produce un modelo de regresión estadísticamente significativo. El segundo paso, que agrega la tasa de enfriamiento al modelo, aumenta el R2 de desviación ajustado, lo que indica que la tasa de enfriamiento mejora el modelo. El tercer paso, que agrega la temperatura de cocción al modelo, aumenta el R2 de desviación, pero no el R2 de desviación ajustado. Estos resultados indican que la temperatura de cocción no mejora el modelo. Con base en estos resultados, considere eliminar la temperatura de cocción del modelo.
La organización de los datos afecta el valor de R2 de desviación ajustado. Para los mismos datos, el R2 de desviación ajustado suele ser más alto para datos con múltiples pruebas por fila que para datos con una sola prueba por fila. Utilice el R2 de desviación ajustado solo para comparar el ajuste de modelos que tengan el mismo formato de datos. Para obtener más información, vaya a Cómo los formatos de datos afectan la bondad de ajuste en regresión logística binaria.
El criterio de información de Akaike (AIC), el criterio de información de Akaike corregido (AICc) y el criterio de información bayesiano (BIC) son medidas de la calidad relativa de un modelo que representan el ajuste y el número de términos en el modelo.