Diagnósticos en regresión logística binaria

Después de cualquier procedimiento de modelado, por lo general se valida el modelo. Estadísticas > Regresión > Regresión logística binaria > Ajustar modelo logístico binario tiene un conjunto de gráficas de diagnóstico, pruebas de bondad de ajuste y otras medidas de diagnóstico para validar el modelo. Los residuos y otros estadísticos de diagnóstico ayudan a encontrar los siguientes problemas potenciales:
  • Patrones de factores/covariables que no tienen un ajuste aceptable
  • Patrones de factores/covariables que tienen un gran efecto en las estimaciones de los parámetros
  • Patrones de factores/covariables que tienen un gran apalancamiento

Minitab proporciona diferentes opciones para cada uno de estos problemas potenciales, como se indica en la siguiente tabla. Hosmer y Lemeshow1 indican que estos diagnósticos se deben interpretar de manera conjunta para entender los posibles problemas con el modelo.

Problema potencial Estadístico de diagnóstico Definición del estadístico
Patrones de factores/covariables que no tienen un ajuste aceptable Residuo de Pearson La diferencia entre la observación real y la pronosticada
Residuo estandarizado de Pearson La diferencia entre la observación real y la pronosticada, pero estandarizada para tener σ = 1
Residuo de desviación Residuos de desviación, un componente de la chi-cuadrada de desviación
Delta chi-cuadrado Cambios en la chi-cuadrada de Pearson cuando se elimina el jésimo patrón de factores/covariables
Desviación delta Cambios en la desviación cuando se elimina el jésimo patrón de factores/covariables
Patrones de factores/covariables que tienen un gran efecto en las estimaciones de los parámetros Delta beta calculado con los residuos de Pearson Cambios en los coeficientes cuando se elimina el jésimo patrón de factores/covariables
Delta beta calculado con los residuos estandarizados de Pearson Cambios en los coeficientes cuando se elimina el jésimo patrón de factores/covariables
Patrones de factores/covariables que tienen un gran apalancamiento Apalancamiento (Hi) Apalancamientos del jésimo patrón de factores/covariables, una medida de qué tan poco comunes son los valores predictores

Las gráficas de residuos le permiten visualizar algunos de estos diagnósticos. Usted también puede almacenar y graficar otros diagnósticos. El delta chi-cuadrado y la desviación delta son útiles para identificar patrones de factores/covariables que no se ajustan adecuadamente al modelo. Los estadísticos delta beta son útiles para identificar un patrón de factores/covariables con un gran efecto en las estimaciones de los parámetros. Por lo general, estos estadísticos delta se grafican bien sea en función de la probabilidad estimada del evento o en función del apalancamiento. La probabilidad estimada del evento es la probabilidad del evento, dados los datos y el modelo. Los apalancamientos se utilizan para evaluar qué tan poco comunes son los valores predictores. Puede usar las capacidades de destacado de gráficas de Minitab para identificar puntos que están en una gráfica.

1 Hosmer, D.W. y Lemeshow, S. (2000). Applied Logistic Regression. 2nd Ed. John Wiley and Sons, Inc.