Ejemplo de Regresión logística ordinal

El administrador de un consultorio médico desea saber qué factores influyen en la satisfacción del paciente. Se pregunta a los pacientes si es improbable, algo probable o muy probable que regresen para atención de seguimiento. Los predictores relevantes incluyen la situación laboral, la edad y la proximidad al consultorio.

El administrador utiliza la probabilidad de que un paciente regrese como una variable de respuesta. Las categorías de la variable de respuesta tienen un orden natural que va de poco probable a muy probable, así que la variable de respuesta es ordinal. Puesto que la variable de respuesta es ordinal, el administrador utiliza la regresión logística ordinal para modelar la relación entre los predictores y la variable de respuesta. El administrador utiliza un nivel de significancia de 0.05 para evaluar la significancia estadística del modelo y la bondad de ajuste del modelo.

  1. Abra los datos de muestra, SatisfacciónPaciente.MTW.
  2. Seleccione cualquier celda de la columna Nueva cita.
  3. Haga clic con el botón derecho y elija Propiedades de columna > Orden de valores.
  4. Seleccione Orden especificado por el usuario y organice los valores en este orden:
    • Muy probable
    • Algo probable
    • Improbable
  5. Elija Estadísticas > Regresión > Regresión logística ordinal.
  6. En Respuesta, ingrese 'Nueva cita'.
  7. En Modelo, ingrese Distancia Distancia*Distancia.
  8. Haga clic en Aceptar.

Interpretar los resultados

El valor p para la prueba de que todas las pendientes son cero es menor que 0.05. El bajo valor p indica que la relación entre la variable de respuesta y los predictores es estadísticamente significativa. El valor p para ambas pruebas de bondad de ajuste es mayor que 0.05. Estos valores p altos no proporcionan evidencia de que el modelo sea inadecuado.

En la tabla Regresión logística, los valores p de Distancia y Distancia*Distancia son menores que el nivel de significancia de 0.05. El coeficiente de Distancia es negativo, lo que indica que, por lo general, es menos probable que los pacientes que viven más lejos del consultorio regresen para una consulta de seguimiento. El coeficiente de Distancia*Distancia es positivo, lo que indica que después de cierta distancia es más probable que los pacientes regresen. Con base en estos resultados, el gerente teoriza que es más probable que los pacientes que viven cerca del consultorio hagan una cita de seguimiento debido a la conveniente ubicación del consultorio. También es más probable que los pacientes que estén dispuestos a viajar una distancia larga para una cita inicial regresen para una consulta de seguimiento. El gerente planea agregar nuevas preguntas a la encuesta para investigar estas ideas. El gerente también planea estudiar las predicciones del modelo para determinar la distancia a la que es más probable que los pacientes regresen.

Regresión logística ordinal: Nueva cita vs. Distancia

* ADVERTENCIA * El algoritmo no ha convergido después de 20 iteraciones. * ADVERTENCIA * No se ha alcanzado la convergencia ni en la log-verosimilitud ni en el criterio de estimaciones del parámetro. * ADVERTENCIA * Los resultados podrían no ser confiables. * ADVERTENCIA * Intente elevar el número máximo de iteraciones.

Función de enlace: Logit

Información de respuesta Variable Valor Conteo Nueva cita Improbable 2 Muy probable 3 Algo probable 4 Total 9
Tabla de regresión logística Relación de Predictor Coef SE Coef Z P probabilidades Const(1) -8.37842 44.7209 -0.19 0.851 Const(2) -6.68100 44.7154 -0.15 0.881 Distancia 3.06326 13.2432 0.23 0.817 21.40 Distancia*Distancia -0.285089 0.962191 -0.30 0.767 0.75 IC de 95% Predictor Inferior Superior Const(1) Const(2) Distancia 0.00 4.00884E+12 Distancia*Distancia 0.11 4.96

Log-verosimilitud = -292.087

La prueba de que todas las pendientes son cero GL G Valor p 2 0.000 1.000
Pruebas de bondad del ajuste Método Chi-cuadrada GL P Pearson 79.970 100 0.930 Desviación 541.172 100 0.000
Medidas de asociación: (Entre la variable de respuesta y las probabilidades pronosticadas) Pares Número Porcentaje Medidas de resumen Concordante 274 79.2 D de Somers 0.77 Discordante 6 1.7 Gamma de Goodman-Kruskal 0.96 Empates 66 19.1 Tau-a de Kendall 0.10 Total 346 100.0