La regresión logística ordinal estima un coeficiente para cada término incluido en el modelo. Los coeficientes de los términos incluidos en el modelo son iguales para cada categoría de resultado.
La regresión logística ordinal también calcula un coeficiente constante para todas menos una de las categorías de resultado. Los coeficientes constantes, en combinación con los coeficientes de las variables, forman un conjunto de ecuaciones de regresión binaria. La primera ecuación estima la probabilidad de que ocurra el primer evento. La segunda ecuación estima la probabilidad de que ocurran los eventos primero o segundo. La tercera ecuación estima la probabilidad de que ocurran los eventos primero, segundo o tercero, y así sucesivamente. Minitab etiqueta estos coeficientes constantes como Const (1), Const (2), Const (3), y así sucesivamente.
Utilice los coeficientes para examinar cómo cambia la probabilidad de un resultado a medida que cambian las variables predictoras. El coeficiente estimado para un predictor representa el cambio en la función de enlace por cada cambio de una unidad en el predictor, mientras los demás predictores incluidos en el modelo se mantienen constantes. La relación entre el coeficiente y la probabilidad de un resultado depende de varios aspectos del análisis, incluyendo la función de enlace, el orden de las categorías de respuesta y los niveles de referencia para los predictores categóricos que están en el modelo. Por lo general, los coeficientes positivos hacen que el primer evento y los eventos que están más cercanos a él sean más probables a medida que aumenta el predictor. Los coeficientes negativos hacen que el último evento y los eventos más cercanos a él sean más probables a medida que aumenta el predictor. Un coeficiente estimado cercano a 0 implica que el efecto del predictor es pequeño.
Por ejemplo, un análisis de una encuesta de satisfacción del paciente examina la relación entre la distancia que tuvo que recorrer un paciente y la probabilidad de que el paciente regrese. El primer evento es el primero en la tabla de información de respuesta. En este caso, el primer evento es "Muy probable" y el último evento es "Improbable". El coeficiente negativo de la distancia muestra que a medida que aumenta la distancia, es más probable que los pacientes contesten "Improbable".
Variable | Valor | Conteo |
---|---|---|
Nueva cita | Muy probable | 19 |
Algo probable | 43 | |
Improbable | 11 | |
Total | 73 |
Relación de probabilidades | IC de 95% | ||||||
---|---|---|---|---|---|---|---|
Predictor | Coef | SE Coef | Z | P | Inferior | Superior | |
Const(1) | -0.505898 | 0.938791 | -0.54 | 0.590 | |||
Const(2) | 2.27788 | 0.985924 | 2.31 | 0.021 | |||
Distancia | -0.0470551 | 0.0797374 | -0.59 | 0.555 | 0.95 | 0.82 | 1.12 |
Para los predictores categóricos, el cambio es del nivel de referencia al nivel del predictor que se encuentra en la tabla de regresión logística. Por lo general, los coeficientes positivos indican que el primer evento es más probable en el nivel del factor que se encuentra en la tabla de regresión logística que en el nivel de referencia del factor. Los coeficientes negativos indican que el último evento es más probable en el nivel del factor que se encuentra en la tabla de regresión logística que en el nivel de referencia del factor.
Por ejemplo, un análisis de una encuesta de satisfacción del paciente examina la relación entre la situación laboral del paciente y la probabilidad de que el paciente regrese. El primer evento es "Muy probable" y el último evento es "Improbable". La situación laboral puede ser "Desempleado" o "Empleado". El nivel de referencia del predictor, que no se encuentra en la tabla de regresión logística, es "Empleado". El coeficiente negativo con el nivel "Desempleado" indica que los pacientes que están desempleados tienen más probabilidades de contestar "Improbable" que los pacientes empleados.
Variable | Valor | Conteo |
---|---|---|
Nueva cita | Muy probable | 19 |
Algo probable | 43 | |
Improbable | 11 | |
Total | 73 |
Relación de probabilidades | IC de 95% | ||||||
---|---|---|---|---|---|---|---|
Predictor | Coef | SE Coef | Z | P | Inferior | Superior | |
Const(1) | -0.707512 | 0.352815 | -2.01 | 0.045 | |||
Const(2) | 2.12316 | 0.444672 | 4.77 | 0.000 | |||
Situación laboral | |||||||
Desempleado | -0.631468 | 0.471078 | -1.34 | 0.180 | 0.53 | 0.21 | 1.34 |
Los coeficientes constantes se combinan con los términos de los predictores para estimar las probabilidades. Minitab puede almacenar estas probabilidades para las observaciones incluidas en la hoja de trabajo cuando se realice el análisis. Para obtener más información, vaya a Almacenar los estadísticos de la Regresión logística ordinal.
El error estándar del coeficiente estima la variabilidad entre las estimaciones del coeficiente que se obtendrían si se tomara las muestras de la misma población una y otra vez. El cálculo asume que el tamaño de la muestra y los coeficientes a estimar se mantendrían iguales si se tomara la muestra una y otra vez.
Utilice el error estándar del coeficiente para medir la precisión de la estimación del coeficiente. Cuanto menor sea el error estándar, más precisa será la estimación.
El valor Z es un estadístico de prueba que mide la relación entre el coeficiente y su error estándar.
Minitab utiliza el valor Z para calcular el valor p, que se usa para tomar una decisión acerca de la significancia estadística de los términos y el modelo. La prueba es exacta cuando el tamaño de la muestra es lo suficientemente grande como para que la distribución de los coeficientes de la muestra siga una distribución normal.
Un valor Z que esté lo suficientemente lejos de 0 indica que la estimación del coeficiente es lo suficientemente grande y precisa como para ser significativamente diferente de 0. En cambio, un valor Z pequeño que está cerca de 0 indica que la estimación del coeficiente es demasiado pequeña o demasiado imprecisa como para asegurar que el término tiene un efecto significativo sobre la respuesta.
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.
La relación de probabilidades compara las probabilidades de dos eventos. Las probabilidades de un evento son la probabilidad de que el evento ocurra dividida entre la probabilidad de que el evento no ocurra. Minitab calcula las relaciones de probabilidades cuando el modelo utiliza la función de enlace logit.
Utilice la relación de probabilidades para entender el efecto de un predictor. La interpretación de la relación de probabilidades depende de si el predictor es categórico o continuo.
Las relaciones de probabilidades que son mayores que 1 indican que el primer evento y los eventos más cercanos al primer evento son más probables a medida que aumenta el predictor. Las relaciones de probabilidades que son menores que 1 indican que el último evento y los eventos más cercanos a él son más probables a medida que aumenta el predictor.
Por ejemplo, un análisis de una encuesta de satisfacción del paciente examina la relación entre la distancia que tuvo que recorrer un paciente y la probabilidad de que el paciente regrese. El primer evento es el primero en la tabla de información de respuesta. En este caso, el primer evento es "Muy probable" y el último evento es "Improbable". La relación de probabilidades de 0.95 para la distancia muestra que a medida que aumenta la distancia, es más probable que los pacientes contesten "Improbable". Por cada milla adicional que viaja un paciente, las probabilidades de que la respuesta del paciente sea "Muy probable" en lugar de "Algo probable" o "Improbable" disminuyen alrededor de 5%.
Variable | Valor | Conteo |
---|---|---|
Nueva cita | Muy probable | 19 |
Algo probable | 43 | |
Improbable | 11 | |
Total | 73 |
Relación de probabilidades | IC de 95% | ||||||
---|---|---|---|---|---|---|---|
Predictor | Coef | SE Coef | Z | P | Inferior | Superior | |
Const(1) | -0.505898 | 0.938791 | -0.54 | 0.590 | |||
Const(2) | 2.27788 | 0.985924 | 2.31 | 0.021 | |||
Distancia | -0.0470551 | 0.0797374 | -0.59 | 0.555 | 0.95 | 0.82 | 1.12 |
Para los predictores categóricos, la relación de probabilidades compara las probabilidades de que el evento ocurra en dos niveles diferentes del predictor. Las relaciones de probabilidades que son mayores que 1 indican que el primer evento y los eventos más cercanos al primer evento son más probables en el nivel del predictor incluido en la tabla de regresión logística que en el nivel de referencia del predictor. Las relaciones de probabilidades que son menores que 1 indican que el último evento y los eventos que están más cercanos a él son más probables en el nivel del predictor incluido en la tabla de regresión logística que en el nivel de referencia.
Por ejemplo, un análisis de una encuesta de satisfacción del paciente examina la relación entre la situación laboral del paciente y la probabilidad de que el paciente regrese. El primer evento es "Muy probable" y el último evento es "Improbable". La situación laboral puede ser "Desempleado" o "Empleado". El nivel de referencia del predictor, que no se encuentra en la tabla de regresión logística, es "Empleado". La relación de probabilidades es menor que 1, por lo que es más probable que un paciente empleado conteste que es "Muy probable" que regrese en comparación con un paciente desempleado. Las probabilidades de que un paciente desempleado conteste "Muy probable" en lugar de "Algo probable" o "Improbable" son el 53% de las probabilidades de que un paciente empleado conteste "Muy probable". Además, las probabilidades de que un paciente desempleado conteste "Muy probable" o "Algo probable" en lugar de "Improbable" son el 53% de las probabilidades de que un paciente empleado conteste "Muy probable" o "Algo probable".
Variable | Valor | Conteo |
---|---|---|
Nueva cita | Muy probable | 19 |
Algo probable | 43 | |
Improbable | 11 | |
Total | 73 |
Relación de probabilidades | IC de 95% | ||||||
---|---|---|---|---|---|---|---|
Predictor | Coef | SE Coef | Z | P | Inferior | Superior | |
Const(1) | -0.707512 | 0.352815 | -2.01 | 0.045 | |||
Const(2) | 2.12316 | 0.444672 | 4.77 | 0.000 | |||
Situación laboral | |||||||
Desempleado | -0.631468 | 0.471078 | -1.34 | 0.180 | 0.53 | 0.21 | 1.34 |
Las relaciones de probabilidades utilizan el orden de las categorías, por lo que las relaciones no describen cómo cambian las probabilidades para las categorías que no siguen un orden. Por ejemplo, la relación de probabilidades no describe el cambio en las probabilidades de que el paciente conteste "Algo probable" en lugar de "Muy probable" o "Improbable". Para modelar categorías que tengan un orden arbitrario, utilice la regresión logística nominal.
Estos intervalos de confianza (IC) son rangos de valores que probablemente contienen los verdaderos valores de las relaciones de probabilidades. El cálculo de los intervalos de confianza utiliza la distribución normal. El intervalo de confianza es exacto si el tamaño de la muestra es lo suficientemente grande como para que la distribución de las relaciones de probabilidades de la muestra siga una distribución normal.
Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si toma muchas muestras aleatorias, un determinado porcentaje de los intervalos de confianza resultantes incluirá el parámetro de población desconocido. El porcentaje de estos intervalos de confianza que contiene el parámetro es el nivel de confianza del intervalo.
Utilice el intervalo de confianza para evaluar la estimación de la relación de probabilidades.
Por ejemplo, con un nivel de confianza de 95%, usted puede estar 95% seguro de que el intervalo de confianza contiene el valor de la relación de probabilidades para la poblaicón. El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra.
Esta prueba es una prueba general que considera todos los coeficientes de un predictor categórico de manera simultánea. La prueba es para los predictores categóricos con más de 2 niveles.
Utilice la prueba para determinar si un predictor categórico con más de 1 coeficiente tiene una relación estadísticamente significativa con los eventos de respuesta. Cuando un predictor categórico tiene más de 2 niveles, los coeficientes de los niveles individuales tienen valores p diferentes. La prueba general proporciona una sola respuesta acerca de si el predictor es estadísticamente significativo.
Minitab maximiza la función de log-verosimilitud para encontrar los valores óptimos de los coeficientes estimados.
Utilice la log-verosimilitud para comparar dos modelos que utilizan los mismos datos para estimar los coeficientes. Puesto que los valores son negativos, cuanto más cercano a 0 esté el valor, mejor se ajustará el modelo a los datos.
La log-verosimilitud no puede disminuir cuando se agregan términos a un modelo. Por ejemplo, un modelo con 5 términos tiene una log-verosimilitud mayor que la de cualquier modelo de 4 términos que se pueda crear con los mismos términos. Por lo tanto, la log-verosimilitud es más útil cuando se comparan modelos del mismo tamaño. Para tomar decisiones sobre términos individuales, por lo general se examinan los valores p del término en los diferentes logits.
Esta prueba es una prueba general que considera todos los coeficientes de los predictores incluidos en el modelo.
Utilice la prueba para determinar si al menos uno de los predictores incluidos en el modelo tiene una asociación estadísticamente significativa con los eventos de respuesta. Por lo general, usted no interpreta el estadístico G ni los grados de libertad (GL). Los GL son iguales al número de coeficientes para los predictores incluidos en el modelo.