Ejemplo de Regresión logística ordinal

El administrador de un consultorio médico desea saber qué factores influyen en la satisfacción del paciente. Se pregunta a los pacientes si es improbable, algo probable o muy probable que regresen para atención de seguimiento. Los predictores relevantes incluyen la situación laboral, la edad y la proximidad al consultorio.

El administrador utiliza la probabilidad de que un paciente regrese como una variable de respuesta. Las categorías de la variable de respuesta tienen un orden natural que va de poco probable a muy probable, así que la variable de respuesta es ordinal. Puesto que la variable de respuesta es ordinal, el administrador utiliza la regresión logística ordinal para modelar la relación entre los predictores y la variable de respuesta. El administrador utiliza un nivel de significancia de 0.05 para evaluar la significancia estadística del modelo y la bondad de ajuste del modelo.

  1. Abra los datos de muestra, SatisfacciónPaciente.MTW.
  2. Seleccione cualquier celda de la columna Nueva cita.
  3. Haga clic con el botón derecho y elija Propiedades de columna > Orden de valores.
  4. Seleccione Orden especificado por el usuario y organice los valores en este orden:
    • Muy probable
    • Algo probable
    • Improbable
  5. Elija Estadísticas > Regresión > Regresión logística ordinal.
  6. En Respuesta, ingrese 'Nueva cita'.
  7. En Modelo, ingrese DistanciaDistancia*Distancia.
  8. Haga clic en Aceptar.

Interpretar los resultados

El valor p para la prueba de que todas las pendientes son cero es menor que 0.05. El bajo valor p indica que la relación entre la variable de respuesta y los predictores es estadísticamente significativa. El valor p para ambas pruebas de bondad de ajuste es mayor que 0.05. Estos valores p altos no proporcionan evidencia de que el modelo sea inadecuado.

En la tabla Regresión logística, los valores p de Distancia y Distancia*Distancia son menores que el nivel de significancia de 0.05. El coeficiente de Distancia es negativo, lo que indica que, por lo general, es menos probable que los pacientes que viven más lejos del consultorio regresen para una consulta de seguimiento. El coeficiente de Distancia*Distancia es positivo, lo que indica que después de cierta distancia es más probable que los pacientes regresen. Con base en estos resultados, el gerente teoriza que es más probable que los pacientes que viven cerca del consultorio hagan una cita de seguimiento debido a la conveniente ubicación del consultorio. También es más probable que los pacientes que estén dispuestos a viajar una distancia larga para una cita inicial regresen para una consulta de seguimiento. El gerente planea agregar nuevas preguntas a la encuesta para investigar estas ideas. El gerente también planea estudiar las predicciones del modelo para determinar la distancia a la que es más probable que los pacientes regresen.

Regresión logística ordinal: Nueva cita vs. Distancia
Función de enlace: Logit

Información de respuesta

VariableValorConteo
Nueva citaMuy probable19
  Algo probable43
  Improbable11
  Total73

Tabla de regresión logística






Relación de
probabilidades
IC de 95%
PredictorCoefSE CoefZPInferiorSuperior
Const(1)6.386713.061102.090.037     
Const(2)9.318833.159292.950.003     
Distancia-1.256080.523879-2.400.0170.280.100.80
Distancia*Distancia0.04954270.02146362.310.0211.051.011.10
Log-verosimilitud = -66.118

La prueba de que todas las pendientes son cero

GLGValor p
26.0660.048

Pruebas de bondad de ajuste

MétodoChi-cuadradaGLP
Pearson114.9031000.146
Desviación94.7791000.629

Medidas de asociación:

(Entre la variable de respuesta y las probabilidades pronosticadas)
ParesNúmeroPorcentajeMedidas de resumenValor
Concordante93862.6D de Somers0.29
Discordante50533.7Gamma de Goodman-Kruskal0.30
Empates563.7Tau-a de Kendall0.16
Total1499100.0