Interpretar los resultados clave para Regresión logística ordinal

Complete los siguientes pasos para interpretar un modelo de regresión logística ordinal. La salida clave incluye el valor p, los coeficientes, la log-verosimilitud y las medidas de asociación.

Paso 1: Determinar si la asociación entre la respuesta y los términos es estadísticamente significativa

Para determinar si la asociación entre la respuesta y cada término en el modelo es estadísticamente significativa, compare el valor p del término con su nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que no hay asociación entre el término y la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0,05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el término.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que existe una asociación estadísticamente significativa entre la variable de respuesta y el término. Le convendría reajustar el modelo sin el término.
Si hay múltiples predictores sin una asociación estadísticamente significativa con la respuesta, usted puede reducir el modelo eliminando términos uno a la vez. Para obtener más información sobre cómo eliminar términos del modelo, vaya a Reducción del modelo.

Para un factor categórico con más de 2 niveles, la hipótesis para el coeficiente es acerca de si ese nivel del factor es diferente del nivel de referencia para el factor. Para evaluar la significancia estadística del factor, utilice la prueba para los términos con más de 1 grado de libertad. Para obtener más información sobre cómo mostrar esta prueba, vaya a Seleccionar los resultados que se mostrarán para Regresión logística ordinal.

Información de respuesta Variable Valor Conteo Nueva cita Muy probable 19 Algo probable 43 Improbable 11 Total 73
Tabla de regresión logística IC de Relación de 95% Predictor Coef SE Coef Z P probabilidades Inferior Const(1) -0.505898 0.938791 -0.54 0.590 Const(2) 2.27788 0.985924 2.31 0.021 Distancia -0.0470551 0.0797374 -0.59 0.555 0.95 0.82
Resultados clave: Valor p, coeficientes

Un análisis de una encuesta de satisfacción del paciente examina la relación entre la distancia que tuvo que recorrer un paciente y la probabilidad de que el paciente regrese. In these results, the distance is not statistically significant at the significance level of 0.05. No puede concluir que los cambios en las distancias están asociados con cambios en las probabilidades de que se produzcan los diferentes eventos.

Evalúe el coeficiente para determinar si un cambio en la variable predictora hace que cualquiera de los eventos sea más o menos probable. La relación entre el coeficiente y las probabilidades depende de varios aspectos del análisis, incluyendo la función de enlace. Los coeficientes positivos hacen que el primer evento y los eventos que están más cercanos a él sean más probables a medida que aumenta el predictor. Los coeficientes negativos hacen que el último evento y los eventos más cercanos a él sean más probables a medida que aumenta el predictor. Para obtener más información, vaya a Coef.

El coeficiente para Distancia es aproximadamente −0,05, lo que sugiere que las distancias más largas están asociadas a mayores probabilidades de la respuesta "Improbable" y con menores probabilidades de la respuesta "Muy probable".

Paso 2: Determinar qué tan bien se ajusta el modelo a los datos

Para determinar qué tan bien se ajusta el modelo a los datos, examine la log-verosimilitud y las medidas de asociación. Valores más grandes de la log-verosimilitud indican un mejor ajuste a los datos. Puesto que los valores de log-verosimilitud son negativos, cuanto más cercano a 0, mayor será el valor. La log-verosimilitud depende de los datos de la muestra, por lo que se puede utilizar la log-verosimilitud para comparar modelos de diferentes conjuntos de datos.

La log-verosimilitud no puede disminuir cuando se agregan términos a un modelo. Por ejemplo, un modelo con 5 términos tiene una log-verosimilitud mayor que la de cualquier modelo de 4 términos que se pueda crear con los mismos términos. Por lo tanto, la log-verosimilitud es más útil cuando se comparan modelos del mismo tamaño. Para tomar decisiones sobre términos individuales, por lo general se examinan los valores p del término en los diferentes logits.

Valores más grandes de los estadísticos D de Somers, gamma de Goodman-Kruskal y tau-a de Kendall indican que el modelo tiene mejor capacidad de predicción. La D de Somers y la gamma de Goodman-Kruskal pueden estar entre -1 y 1. La tau-a de Kendall puede estar entre -2/3 y 2/3. Valores cercanos al máximo indican que el modelo tiene una capacidad predictiva adecuada. Valores cercanos a 0 indican que el modelo no tiene una relación predictiva con la respuesta. Los valores negativos son raros en la práctica, porque ese desempeño es peor que cuando el modelo y la respuesta no están relacionados.

Regresión logística ordinal: Nueva cita vs. Distancia

Función de enlace: Logit

Información de respuesta Variable Valor Conteo Nueva cita Muy probable 19 Algo probable 43 Improbable 11 Total 73
Tabla de regresión logística IC de Relación de 95% Predictor Coef SE Coef Z P probabilidades Inferior Const(1) -0.505898 0.938791 -0.54 0.590 Const(2) 2.27788 0.985924 2.31 0.021 Distancia -0.0470551 0.0797374 -0.59 0.555 0.95 0.82
Predictor Superior Const(1) Const(2) Distancia 1.12

Log-verosimilitud = -68.987

La prueba de que todas las pendientes son cero GL G Valor p 1 0.328 0.567
Pruebas de bondad del ajuste Método Chi-cuadrada GL P Pearson 97.419 101 0.582 Desviación 100.516 101 0.495
Medidas de asociación: (Entre la variable de respuesta y las probabilidades pronosticadas) Pares Número Porcentaje Medidas de resumen Concordante 832 55.5 D de Somers 0.13 Discordante 637 42.5 Gamma de Goodman-Kruskal 0.13 Empates 30 2.0 Tau-a de Kendall 0.07 Total 1499 100.0
Resultados clave: Log-verosimilitud, D de Somers, gamma de Goodman-Kruskal, tau-a de Kendall

Por ejemplo, el gerente de un consultorio médico estudia los factores que influyen en la satisfacción del paciente. En este primer conjunto de resultados, la distancia que un paciente viaja para llegar a un consultorio predice qué tan probable es que el paciente diga que regresará. La log-verosimilitud es −68.987. La D de Somers y la gamma de Goodman-Kruskal son 0.13. La tau-a de Kendall es 0.07. Estos valores, que están cerca de 0, sugieren que la relación entre la distancia y la respuesta es débil. El valor p para la prueba de que todas las pendientes son iguales a cero es mayor que 0.05, por lo que el gerente prueba con un modelo diferente.

En este segundo conjunto de resultados, tanto la distancia como el cuadrado de la distancia son predictores. No se puede utilizar la log-verosimilitud para comparar estos modelos porque tienen diferentes cantidades de términos. Las medidas de asociación son mayores para el segundo modelo, lo que indica que el segundo modelo funciona mejor que el primer modelo.

Regresión logística ordinal: Nueva cita vs. Distancia

* ADVERTENCIA * El algoritmo no ha convergido después de 20 iteraciones. * ADVERTENCIA * No se ha alcanzado la convergencia ni en la log-verosimilitud ni en el criterio de estimaciones del parámetro. * ADVERTENCIA * Los resultados podrían no ser confiables. * ADVERTENCIA * Intente elevar el número máximo de iteraciones.

Función de enlace: Logit

Información de respuesta Variable Valor Conteo Nueva cita Improbable 2 Muy probable 3 Algo probable 4 Total 9
Tabla de regresión logística Relación de Predictor Coef SE Coef Z P probabilidades Const(1) -8.37842 44.7209 -0.19 0.851 Const(2) -6.68100 44.7154 -0.15 0.881 Distancia 3.06326 13.2432 0.23 0.817 21.40 Distancia*Distancia -0.285089 0.962191 -0.30 0.767 0.75 IC de 95% Predictor Inferior Superior Const(1) Const(2) Distancia 0.00 4.00884E+12 Distancia*Distancia 0.11 4.96

Log-verosimilitud = -292.087

La prueba de que todas las pendientes son cero GL G Valor p 2 0.000 1.000
Pruebas de bondad del ajuste Método Chi-cuadrada GL P Pearson 79.970 100 0.930 Desviación 541.172 100 0.000
Medidas de asociación: (Entre la variable de respuesta y las probabilidades pronosticadas) Pares Número Porcentaje Medidas de resumen Concordante 274 79.2 D de Somers 0.77 Discordante 6 1.7 Gamma de Goodman-Kruskal 0.96 Empates 66 19.1 Tau-a de Kendall 0.10 Total 346 100.0