Interpretar los resultados clave para Regresión logística ordinal

Complete los siguientes pasos para interpretar un modelo de regresión logística ordinal. La salida clave incluye el valor p, los coeficientes, la log-verosimilitud y las medidas de asociación.

Paso 1: Determinar si la asociación entre la respuesta y los términos es estadísticamente significativa

Para determinar si la asociación entre la respuesta y cada término en el modelo es estadísticamente significativa, compare el valor p del término con su nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que no hay asociación entre el término y la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0,05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el término.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que existe una asociación estadísticamente significativa entre la variable de respuesta y el término. Le convendría reajustar el modelo sin el término.
Si hay múltiples predictores sin una asociación estadísticamente significativa con la respuesta, usted puede reducir el modelo eliminando términos uno a la vez. Para obtener más información sobre cómo eliminar términos del modelo, vaya a Reducción del modelo.

Para un factor categórico con más de 2 niveles, la hipótesis para el coeficiente es acerca de si ese nivel del factor es diferente del nivel de referencia para el factor. Para evaluar la significancia estadística del factor, utilice la prueba para los términos con más de 1 grado de libertad. Para obtener más información sobre cómo mostrar esta prueba, vaya a Seleccionar los resultados que se mostrarán para Regresión logística ordinal.

Información de respuesta

VariableValorConteo
Nueva citaMuy probable19
  Algo probable43
  Improbable11
  Total73

Tabla de regresión logística






Relación de
probabilidades
IC de 95%
PredictorCoefSE CoefZPInferiorSuperior
Const(1)-0.5058980.938791-0.540.590     
Const(2)2.277880.9859242.310.021     
Distancia-0.04705510.0797374-0.590.5550.950.821.12
Resultados clave: Valor p, coeficientes

Un análisis de una encuesta de satisfacción del paciente examina la relación entre la distancia que tuvo que recorrer un paciente y la probabilidad de que el paciente regrese. In these results, the distance is not statistically significant at the significance level of 0.05. No puede concluir que los cambios en las distancias están asociados con cambios en las probabilidades de que se produzcan los diferentes eventos.

Evalúe el coeficiente para determinar si un cambio en la variable predictora hace que cualquiera de los eventos sea más o menos probable. La relación entre el coeficiente y las probabilidades depende de varios aspectos del análisis, incluyendo la función de enlace. Los coeficientes positivos hacen que el primer evento y los eventos que están más cercanos a él sean más probables a medida que aumenta el predictor. Los coeficientes negativos hacen que el último evento y los eventos más cercanos a él sean más probables a medida que aumenta el predictor. Para obtener más información, vaya a Coef.

El coeficiente para Distancia es aproximadamente −0,05, lo que sugiere que las distancias más largas están asociadas a mayores probabilidades de la respuesta "Improbable" y con menores probabilidades de la respuesta "Muy probable".

Paso 2: Determinar qué tan bien se ajusta el modelo a los datos

Para determinar qué tan bien se ajusta el modelo a los datos, examine la log-verosimilitud y las medidas de asociación. Valores más grandes de la log-verosimilitud indican un mejor ajuste a los datos. Puesto que los valores de log-verosimilitud son negativos, cuanto más cercano a 0, mayor será el valor. La log-verosimilitud depende de los datos de la muestra, por lo que se puede utilizar la log-verosimilitud para comparar modelos de diferentes conjuntos de datos.

La log-verosimilitud no puede disminuir cuando se agregan términos a un modelo. Por ejemplo, un modelo con 5 términos tiene una log-verosimilitud mayor que la de cualquier modelo de 4 términos que se pueda crear con los mismos términos. Por lo tanto, la log-verosimilitud es más útil cuando se comparan modelos del mismo tamaño. Para tomar decisiones sobre términos individuales, por lo general se examinan los valores p del término en los diferentes logits.

Valores más grandes de los estadísticos D de Somers, gamma de Goodman-Kruskal y tau-a de Kendall indican que el modelo tiene mejor capacidad de predicción. La D de Somers y la gamma de Goodman-Kruskal pueden estar entre -1 y 1. La tau-a de Kendall puede estar entre -2/3 y 2/3. Valores cercanos al máximo indican que el modelo tiene una capacidad predictiva adecuada. Valores cercanos a 0 indican que el modelo no tiene una relación predictiva con la respuesta. Los valores negativos son raros en la práctica, porque ese desempeño es peor que cuando el modelo y la respuesta no están relacionados.

Función de enlace: Logit

Información de respuesta

VariableValorConteo
Nueva citaMuy probable19
  Algo probable43
  Improbable11
  Total73

Tabla de regresión logística






Relación de
probabilidades
IC de 95%
PredictorCoefSE CoefZPInferiorSuperior
Const(1)-0.5058980.938791-0.540.590     
Const(2)2.277880.9859242.310.021     
Distancia-0.04705510.0797374-0.590.5550.950.821.12
Log-verosimilitud = -68.987

La prueba de que todas las pendientes son cero

GLGValor p
10.3280.567

Pruebas de bondad de ajuste

MétodoChi-cuadradaGLP
Pearson97.4191010.582
Desviación100.5161010.495

Medidas de asociación:

(Entre la variable de respuesta y las probabilidades pronosticadas)
ParesNúmeroPorcentajeMedidas de resumenValor
Concordante83255.5D de Somers0.13
Discordante63742.5Gamma de Goodman-Kruskal0.13
Empates302.0Tau-a de Kendall0.07
Total1499100.0   
Resultados clave: Log-verosimilitud, D de Somers, gamma de Goodman-Kruskal, tau-a de Kendall

Por ejemplo, el gerente de un consultorio médico estudia los factores que influyen en la satisfacción del paciente. En este primer conjunto de resultados, la distancia que un paciente viaja para llegar a un consultorio predice qué tan probable es que el paciente diga que regresará. La log-verosimilitud es −68.987. La D de Somers y la gamma de Goodman-Kruskal son 0.13. La tau-a de Kendall es 0.07. Estos valores, que están cerca de 0, sugieren que la relación entre la distancia y la respuesta es débil. El valor p para la prueba de que todas las pendientes son iguales a cero es mayor que 0.05, por lo que el gerente prueba con un modelo diferente.

En este segundo conjunto de resultados, tanto la distancia como el cuadrado de la distancia son predictores. No se puede utilizar la log-verosimilitud para comparar estos modelos porque tienen diferentes cantidades de términos. Las medidas de asociación son mayores para el segundo modelo, lo que indica que el segundo modelo funciona mejor que el primer modelo.

Regresión logística ordinal: Nueva cita vs. Distancia
Función de enlace: Logit

Información de respuesta

VariableValorConteo
Nueva citaMuy probable19
  Algo probable43
  Improbable11
  Total73

Tabla de regresión logística






Relación de
probabilidades
IC de 95%
PredictorCoefSE CoefZPInferiorSuperior
Const(1)6.386713.061102.090.037     
Const(2)9.318833.159292.950.003     
Distancia-1.256080.523879-2.400.0170.280.100.80
Distancia*Distancia0.04954270.02146362.310.0211.051.011.10
Log-verosimilitud = -66.118

La prueba de que todas las pendientes son cero

GLGValor p
26.0660.048

Pruebas de bondad de ajuste

MétodoChi-cuadradaGLP
Pearson114.9031000.146
Desviación94.7791000.629

Medidas de asociación:

(Entre la variable de respuesta y las probabilidades pronosticadas)
ParesNúmeroPorcentajeMedidas de resumenValor
Concordante93862.6D de Somers0.29
Discordante50533.7Gamma de Goodman-Kruskal0.30
Empates563.7Tau-a de Kendall0.16
Total1499100.0