Pruebas de bondad de ajuste para Analizar respuesta binaria para diseño de cribado definitivo

Encuentre definiciones y ayuda para interpretar cada estadístico incluido en la tabla Pruebas de bondad de ajuste.

Prueba de bondad de ajuste de desviación

La prueba de bondad de ajuste de la desviación evalúa la discrepancia entre el modelo actual y el modelo completo.

Interpretación

Utilice las pruebas de bondad de ajuste para determinar si las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Si el valor p para la prueba de bondad de ajuste es menor que el nivel de significancia elegido, las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Esta lista indica las razones comunes de la desviación:
  • Función de enlace incorrecta
  • Término de orden superior omitido para las variables que están en el modelo
  • Predictor omitido que no está en el modelo
  • Dispersión excesiva

Si la desviación es estadísticamente significativa, usted puede probar con una función de enlace diferente o cambiar los términos incluidos en el modelo.

Muchos de los estadísticos de bondad de ajuste se ven afectados por cómo están ordenados los datos en la hoja de trabajo y si hay una prueba por fila o múltiples pruebas por fila. El valor p para la prueba de desviación tiende a ser menor para los datos que tienen un solo ensayo por organización de fila en comparación con los datos que poseen múltiples ensayos por fila, y, por lo general, disminuye a medida que disminuyen los ensayos por fila.

La prueba de Hosmer-Lemeshow no depende del formato de los datos. Cuando los datos tienen pocos ensayos por fila, la prueba de Hosmer-Lemeshow es un indicador más confiable de hasta qué punto el modelo se ajusta a los datos. Para obtener más información, vaya a Cómo los formatos de datos afectan la bondad de ajuste en regresión logística binaria.

Prueba de bondad de ajuste de Pearson

La prueba de bondad de ajuste de Pearson evalúa la discrepancia entre el modelo actual y el modelo completo.

Interpretación

Utilice las pruebas de bondad de ajuste para determinar si las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Si el valor p para la prueba de bondad de ajuste es menor que el nivel de significancia elegido, las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Esta lista indica las razones comunes de la desviación:
  • Función de enlace incorrecta
  • Término de orden superior omitido para las variables que están en el modelo
  • Predictor omitido que no está en el modelo
  • Dispersión excesiva

Si la desviación es estadísticamente significativa, usted puede probar con una función de enlace diferente o cambiar los términos incluidos en el modelo.

Muchos de los estadísticos de bondad de ajuste se ven afectados por cómo están ordenados los datos en la hoja de trabajo y si hay una prueba por fila o múltiples pruebas por fila. La aproximación a la distribución de chi-cuadrada que la prueba de Pearson utiliza resulta inexacta cuando el número de eventos esperados por fila en los datos es pequeño. De esta forma, la prueba de Pearson de bondad de ajuste resulta inexacta cuando los datos están en formato de un solo ensayo por fila.

La prueba de Hosmer-Lemeshow no depende del formato de los datos. Cuando los datos tienen pocos ensayos por fila, la prueba de Hosmer-Lemeshow es un indicador más confiable de hasta qué punto el modelo se ajusta a los datos. Para obtener más información, vaya a Cómo los formatos de datos afectan la bondad de ajuste en regresión logística binaria.

Hosmer-Lemeshow

La prueba de bondad de ajuste de Hosmer-Lemeshow compara las frecuencias observadas y esperadas de eventos y no-eventos para evaluar hasta qué punto el modelo se ajusta a los datos.

Interpretación

Utilice las pruebas de bondad de ajuste para determinar si las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Si el valor p para la prueba de bondad de ajuste es menor que el nivel de significancia elegido, las probabilidades pronosticadas se desvían de las probabilidades observadas de una manera que la distribución binomial no predice. Esta lista indica las razones comunes de la desviación:
  • Función de enlace incorrecta
  • Término de orden superior omitido para las variables que están en el modelo
  • Predictor omitido que no está en el modelo
  • Dispersión excesiva

Si la desviación es estadísticamente significativa, usted puede probar con una función de enlace diferente o cambiar los términos incluidos en el modelo.

La prueba de Hosmer-Lemeshow no depende del número de ensayos por fila en los datos como lo hacen las otras pruebas de bondad de ajuste. Cuando los datos tienen pocos ensayos por fila, la prueba de Hosmer-Lemeshow es un indicador más confiable de hasta qué punto el modelo se ajusta a los datos.

Frecuencias observadas y esperadas de la prueba de Hosmer-Lemeshow

El modelo predice las frecuencias esperadas de la prueba de Hosmer-Lemeshow.

Interpretación

Utilice las frecuencias observadas y esperadas de la prueba de Hosmer-Lemeshow para describir qué tan bien se ajusta el modelo a los datos o para buscar áreas de ajuste deficiente.

Por ejemplo, el modelo con el término X produce pruebas de bondad de ajuste con valores p pequeños, lo que indica que el modelo se ajusta deficientemente a los datos. En la tabla de frecuencias observadas y esperadas, los valores esperados son diferentes por más de 10 eventos para todos los grupos a excepción del grupo 4, cuando la probabilidad del evento está entre 0.32 y 0.325.

Cuando el modelo incluye X y X*X, las pruebas de bondad de ajuste tienen valores p grandes. Los datos no proporcionan evidencia de que las probabilidades estimadas se desvíen de las probabilidades observadas de una manera que la distribución binomial no predice. La mayor diferencia entre el número observado y esperado de eventos está en el grupo 4. Esta diferencia es aproximadamente 7.

Regresión logística binaria: Evento vs. X

Coeficientes EE del Término Coef coef. FIV Constante -0.800 0.167 X 0.00092 0.00271 1.00
Pruebas de bondad del ajuste Prueba GL Chi-cuadrada Valor p Desviación 3 78.50 0.000 Pearson 3 74.96 0.000 Hosmer-Lemeshow 3 74.96 0.000
Frecuencias observadas y esperadas para la prueba de Hosmer-Lemeshow Rango de probabilidades Evento Sin evento Grupo del evento Observado Esperado Observado Esperado 1 (0.000, 0.310) 10 31.0 90 69.0 2 (0.310, 0.315) 40 31.5 60 68.5 3 (0.315, 0.320) 60 32.0 40 68.0 4 (0.320, 0.325) 35 32.5 65 67.5 5 (0.325, 0.330) 15 33.0 85 67.0

Regresión logística binaria: Evento vs. X

Información de respuesta Nombre del Variable Valor Conteo evento Evento Evento 160 Evento Sin evento 340 Ensayo Total 500
Coeficientes Término Coef EE del coef. FIV Constante -2.107 0.282 X 0.0904 0.0121 11.97 X*X -0.000889 0.000115 11.97
Pruebas de bondad del ajuste Prueba GL Chi-cuadrada Valor p Desviación 2 3.78 0.151 Pearson 2 3.76 0.152 Hosmer-Lemeshow 3 3.76 0.288
Frecuencias observadas y esperadas para la prueba de Hosmer-Lemeshow Rango de probabilidades Evento Sin evento Grupo del evento Observado Esperado Observado Esperado 1 (0.000, 0.108) 10 10.8 90 89.2 2 (0.108, 0.124) 15 12.4 85 87.6 3 (0.124, 0.401) 40 40.1 60 59.9 4 (0.401, 0.419) 35 41.9 65 58.1 5 (0.419, 0.548) 60 54.8 40 45.2