Pruebas de bondad de ajuste para Ajustar modelo logístico binario

Encuentre definiciones y ayuda para interpretar cada estadístico incluido en la tabla Pruebas de bondad de ajuste.

Prueba de bondad de ajuste de desviación

La prueba de bondad de ajuste de la desviación evalúa la discrepancia entre el modelo actual y el modelo completo.

Interpretación

Utilice las pruebas de bondad de ajuste para determinar si las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Si el valor p para la prueba de bondad de ajuste es menor que el nivel de significancia elegido, las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Esta lista indica las razones comunes de la desviación:
  • Función de enlace incorrecta
  • Término de orden superior omitido para las variables que están en el modelo
  • Predictor omitido que no está en el modelo
  • Dispersión excesiva

Si la desviación es estadísticamente significativa, usted puede probar con una función de enlace diferente o cambiar los términos incluidos en el modelo.

Muchos de los estadísticos de bondad de ajuste se ven afectados por cómo están ordenados los datos en la hoja de trabajo y si hay una prueba por fila o múltiples pruebas por fila. El valor p para la prueba de desviación tiende a ser menor para los datos que tienen un solo ensayo por organización de fila en comparación con los datos que poseen múltiples ensayos por fila, y, por lo general, disminuye a medida que disminuyen los ensayos por fila.

La prueba de Hosmer-Lemeshow no depende del formato de los datos. Cuando los datos tienen pocos ensayos por fila, la prueba de Hosmer-Lemeshow es un indicador más confiable de hasta qué punto el modelo se ajusta a los datos. Para obtener más información, vaya a Cómo los formatos de datos afectan la bondad de ajuste en regresión logística binaria.

Prueba de bondad de ajuste de Pearson

La prueba de bondad de ajuste de Pearson evalúa la discrepancia entre el modelo actual y el modelo completo.

Interpretación

Utilice las pruebas de bondad de ajuste para determinar si las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Si el valor p para la prueba de bondad de ajuste es menor que el nivel de significancia elegido, las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Esta lista indica las razones comunes de la desviación:
  • Función de enlace incorrecta
  • Término de orden superior omitido para las variables que están en el modelo
  • Predictor omitido que no está en el modelo
  • Dispersión excesiva

Si la desviación es estadísticamente significativa, usted puede probar con una función de enlace diferente o cambiar los términos incluidos en el modelo.

Muchos de los estadísticos de bondad de ajuste se ven afectados por cómo están ordenados los datos en la hoja de trabajo y si hay una prueba por fila o múltiples pruebas por fila. La aproximación a la distribución de chi-cuadrada que la prueba de Pearson utiliza resulta inexacta cuando el número de eventos esperados por fila en los datos es pequeño. De esta forma, la prueba de Pearson de bondad de ajuste resulta inexacta cuando los datos están en formato de un solo ensayo por fila.

La prueba de Hosmer-Lemeshow no depende del formato de los datos. Cuando los datos tienen pocos ensayos por fila, la prueba de Hosmer-Lemeshow es un indicador más confiable de hasta qué punto el modelo se ajusta a los datos. Para obtener más información, vaya a Cómo los formatos de datos afectan la bondad de ajuste en regresión logística binaria.

Hosmer-Lemeshow

La prueba de bondad de ajuste de Hosmer-Lemeshow compara las frecuencias observadas y esperadas de eventos y no-eventos para evaluar hasta qué punto el modelo se ajusta a los datos.

Interpretación

Utilice las pruebas de bondad de ajuste para determinar si las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Si el valor p para la prueba de bondad de ajuste es menor que el nivel de significancia elegido, las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Esta lista indica las razones comunes de la desviación:
  • Función de enlace incorrecta
  • Término de orden superior omitido para las variables que están en el modelo
  • Predictor omitido que no está en el modelo
  • Dispersión excesiva

Si la desviación es estadísticamente significativa, usted puede probar con una función de enlace diferente o cambiar los términos incluidos en el modelo.

La prueba de Hosmer-Lemeshow no depende del número de ensayos por fila en los datos como lo hacen las otras pruebas de bondad de ajuste.Cuando los datos tienen pocos ensayos por fila, la prueba de Hosmer-Lemeshow es un indicador más confiable de hasta qué punto el modelo se ajusta a los datos.

Frecuencias observadas y esperadas de la prueba de Hosmer-Lemeshow

El modelo predice las frecuencias esperadas de la prueba de Hosmer-Lemeshow.

Interpretación

Utilice las frecuencias observadas y esperadas de la prueba de Hosmer-Lemeshow para describir qué tan bien se ajusta el modelo a los datos o para buscar áreas de ajuste deficiente.

Por ejemplo, el modelo con el término X produce pruebas de bondad de ajuste con valores p pequeños, lo que indica que el modelo se ajusta deficientemente a los datos. En la tabla de frecuencias observadas y esperadas, los valores esperados son diferentes por más de 10 eventos para todos los grupos a excepción del grupo 4, cuando la probabilidad del evento está entre 0.32 y 0.325.

Cuando el modelo incluye X y X*X, las pruebas de bondad de ajuste tienen valores p grandes. Los datos no proporcionan evidencia de que las probabilidades estimadas se desvíen de las probabilidades observadas de una manera que la distribución binomial no predice. La mayor diferencia entre el número observado y esperado de eventos está en el grupo 4. Esta diferencia es aproximadamente 7.

Modelo con X

Coeficientes

TérminoCoefEE del coef.Valor ZValor pFIV
Constante-0.8000.167-4.790.000 
X0.000920.002710.340.7351.00

Pruebas de bondad de ajuste

PruebaGLChi-cuadradaValor p
Desviación378.500.000
Pearson374.960.000
Hosmer-Lemeshow374.960.000

Frecuencias observadas y esperadas para la prueba de Hosmer-Lemeshow


Rango de
probabilidades
del evento





EventoSin evento
GrupoObservadoEsperadoObservadoEsperado
1(0.000, 0.310)1031.09069.0
2(0.310, 0.315)4031.56068.5
3(0.315, 0.320)6032.04068.0
4(0.320, 0.325)3532.56567.5
5(0.325, 0.330)1533.08567.0

Modelo con X y X*X

Coeficientes

TérminoCoefEE del coef.Valor ZValor pFIV
Constante-2.1070.282-7.460.000 
X0.09040.01217.460.00011.97
X*X-0.0008890.000115-7.750.00011.97

Pruebas de bondad de ajuste

PruebaGLChi-cuadradaValor p
Desviación23.780.151
Pearson23.760.152
Hosmer-Lemeshow33.760.288

Frecuencias observadas y esperadas para la prueba de Hosmer-Lemeshow


Rango de
probabilidades
del evento





EventoSin evento
GrupoObservadoEsperadoObservadoEsperado
1(0.000, 0.108)1010.89089.2
2(0.108, 0.124)1512.48587.6
3(0.124, 0.401)4040.16059.9
4(0.401, 0.419)3541.96558.1
5(0.419, 0.548)6054.84045.2