Tabla Regresión logística para Regresión logística ordinal

Encuentre definiciones y ayuda para interpretar cada estadístico incluido en la tabla Regresión logística.

Coef

La regresión logística ordinal estima un coeficiente para cada término incluido en el modelo. Los coeficientes de los términos incluidos en el modelo son iguales para cada categoría de resultado.

La regresión logística ordinal también calcula un coeficiente constante para todas menos una de las categorías de resultado. Los coeficientes constantes, en combinación con los coeficientes de las variables, forman un conjunto de ecuaciones de regresión binaria. La primera ecuación estima la probabilidad de que ocurra el primer evento. La segunda ecuación estima la probabilidad de que ocurran los eventos primero o segundo. La tercera ecuación estima la probabilidad de que ocurran los eventos primero, segundo o tercero, y así sucesivamente. Minitab etiqueta estos coeficientes constantes como Const (1), Const (2), Const (3), y así sucesivamente.

Interpretación

Utilice los coeficientes para examinar cómo cambia la probabilidad de un resultado a medida que cambian las variables predictoras. El coeficiente estimado para un predictor representa el cambio en la función de enlace por cada cambio de una unidad en el predictor, mientras los demás predictores incluidos en el modelo se mantienen constantes. La relación entre el coeficiente y la probabilidad de un resultado depende de varios aspectos del análisis, incluyendo la función de enlace, el orden de las categorías de respuesta y los niveles de referencia para los predictores categóricos que están en el modelo. Por lo general, los coeficientes positivos hacen que el primer evento y los eventos que están más cercanos a él sean más probables a medida que aumenta el predictor. Los coeficientes negativos hacen que el último evento y los eventos más cercanos a él sean más probables a medida que aumenta el predictor. Un coeficiente estimado cercano a 0 implica que el efecto del predictor es pequeño.

Por ejemplo, un análisis de una encuesta de satisfacción del paciente examina la relación entre la distancia que tuvo que recorrer un paciente y la probabilidad de que el paciente regrese. El primer evento es el primero en la tabla de información de respuesta. En este caso, el primer evento es "Muy probable" y el último evento es "Improbable". El coeficiente negativo de la distancia muestra que a medida que aumenta la distancia, es más probable que los pacientes contesten "Improbable".

Información de respuesta

VariableValorConteo
Nueva citaMuy probable19
  Algo probable43
  Improbable11
  Total73

Tabla de regresión logística






Relación de
probabilidades
IC de 95%
PredictorCoefSE CoefZPInferiorSuperior
Const(1)-0.5058980.938791-0.540.590     
Const(2)2.277880.9859242.310.021     
Distancia-0.04705510.0797374-0.590.5550.950.821.12

Para los predictores categóricos, el cambio es del nivel de referencia al nivel del predictor que se encuentra en la tabla de regresión logística. Por lo general, los coeficientes positivos indican que el primer evento es más probable en el nivel del factor que se encuentra en la tabla de regresión logística que en el nivel de referencia del factor. Los coeficientes negativos indican que el último evento es más probable en el nivel del factor que se encuentra en la tabla de regresión logística que en el nivel de referencia del factor.

Por ejemplo, un análisis de una encuesta de satisfacción del paciente examina la relación entre la situación laboral del paciente y la probabilidad de que el paciente regrese. El primer evento es "Muy probable" y el último evento es "Improbable". La situación laboral puede ser "Desempleado" o "Empleado". El nivel de referencia del predictor, que no se encuentra en la tabla de regresión logística, es "Empleado". El coeficiente negativo con el nivel "Desempleado" indica que los pacientes que están desempleados tienen más probabilidades de contestar "Improbable" que los pacientes empleados.

Información de respuesta

VariableValorConteo
Nueva citaMuy probable19
  Algo probable43
  Improbable11
  Total73

Tabla de regresión logística






Relación de
probabilidades
IC de 95%
PredictorCoefSE CoefZPInferiorSuperior
Const(1)-0.7075120.352815-2.010.045     
Const(2)2.123160.4446724.770.000     
Situación laboral             
  Desempleado-0.6314680.471078-1.340.1800.530.211.34

Nota

Los coeficientes constantes se combinan con los términos de los predictores para estimar las probabilidades. Minitab puede almacenar estas probabilidades para las observaciones incluidas en la hoja de trabajo cuando se realice el análisis. Para obtener más información, vaya a Almacenar los estadísticos de la Regresión logística ordinal.

EE Coef

El error estándar del coeficiente estima la variabilidad entre las estimaciones del coeficiente que se obtendrían si se tomara las muestras de la misma población una y otra vez. El cálculo asume que el tamaño de la muestra y los coeficientes a estimar se mantendrían iguales si se tomara la muestra una y otra vez.

Interpretación

Utilice el error estándar del coeficiente para medir la precisión de la estimación del coeficiente. Cuanto menor sea el error estándar, más precisa será la estimación.

Valor Z

El valor Z es un estadístico de prueba que mide la relación entre el coeficiente y su error estándar.

Interpretación

Minitab utiliza el valor Z para calcular el valor p, que se usa para tomar una decisión acerca de la significancia estadística de los términos y el modelo. La prueba es exacta cuando el tamaño de la muestra es lo suficientemente grande como para que la distribución de los coeficientes de la muestra siga una distribución normal.

Un valor Z que esté lo suficientemente lejos de 0 indica que la estimación del coeficiente es lo suficientemente grande y precisa como para ser significativamente diferente de 0. En cambio, un valor Z pequeño que está cerca de 0 indica que la estimación del coeficiente es demasiado pequeña o demasiado imprecisa como para asegurar que el término tiene un efecto significativo sobre la respuesta.

Valor p

El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

Interpretación

Para determinar si la asociación entre la respuesta y cada término incluido en el modelo es estadísticamente significativa, compare el valor p del término con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que el coeficiente del término es igual a cero, lo que implica que no hay asociación entre el término y la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el término.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que existe una asociación estadísticamente significativa entre la variable de respuesta y el término. Convendría que vuelva a ajustar el modelo sin el término.
Si hay múltiples predictores sin una asociación estadísticamente significativa con la respuesta, usted puede reducir el modelo eliminando términos uno a la vez. Para obtener más información sobre cómo eliminar términos del modelo, vaya a Reducción del modelo.
Si un término del modelo es estadísticamente significativo, la interpretación depende del tipo de término. Las interpretaciones son las siguientes:
  • Si un predictor continuo es significativo, usted puede concluir que las probabilidades del nivel de respuesta dependen del predictor.
  • Si un predictor categórico es significativo, usted puede concluir que los niveles de respuesta tienen diferentes probabilidades de ocurrir a ese nivel del factor que al nivel de referencia del factor.
  • Si un término de interacción es significativo, usted puede concluir que la relación entre un predictor y las probabilidades del nivel de respuesta depende del resto de los predictores en el término.
  • Si un término polinómico es significativo, usted puede concluir que la relación entre un predictor y las probabilidades del nivel de respuesta depende de la magnitud del predictor.

Relación de probabilidades

La relación de probabilidades compara las probabilidades de dos eventos. Las probabilidades de un evento son la probabilidad de que el evento ocurra dividida entre la probabilidad de que el evento no ocurra. Minitab calcula las relaciones de probabilidades cuando el modelo utiliza la función de enlace logit.

Interpretación

Utilice la relación de probabilidades para entender el efecto de un predictor. La interpretación de la relación de probabilidades depende de si el predictor es categórico o continuo.

Relaciones de probabilidades para predictores continuos

Las relaciones de probabilidades que son mayores que 1 indican que el primer evento y los eventos más cercanos al primer evento son más probables a medida que aumenta el predictor. Las relaciones de probabilidades que son menores que 1 indican que el último evento y los eventos más cercanos a él son más probables a medida que aumenta el predictor.

Por ejemplo, un análisis de una encuesta de satisfacción del paciente examina la relación entre la distancia que tuvo que recorrer un paciente y la probabilidad de que el paciente regrese. El primer evento es el primero en la tabla de información de respuesta. En este caso, el primer evento es "Muy probable" y el último evento es "Improbable". La relación de probabilidades de 0.95 para la distancia muestra que a medida que aumenta la distancia, es más probable que los pacientes contesten "Improbable". Por cada milla adicional que viaja un paciente, las probabilidades de que la respuesta del paciente sea "Muy probable" en lugar de "Algo probable" o "Improbable" disminuyen alrededor de 5%.

Información de respuesta

VariableValorConteo
Nueva citaMuy probable19
  Algo probable43
  Improbable11
  Total73

Tabla de regresión logística






Relación de
probabilidades
IC de 95%
PredictorCoefSE CoefZPInferiorSuperior
Const(1)-0.5058980.938791-0.540.590     
Const(2)2.277880.9859242.310.021     
Distancia-0.04705510.0797374-0.590.5550.950.821.12

Relaciones de probabilidades para predictores categóricos

Para los predictores categóricos, la relación de probabilidades compara las probabilidades de que el evento ocurra en dos niveles diferentes del predictor. Las relaciones de probabilidades que son mayores que 1 indican que el primer evento y los eventos más cercanos al primer evento son más probables en el nivel del predictor incluido en la tabla de regresión logística que en el nivel de referencia del predictor. Las relaciones de probabilidades que son menores que 1 indican que el último evento y los eventos que están más cercanos a él son más probables en el nivel del predictor incluido en la tabla de regresión logística que en el nivel de referencia.

Por ejemplo, un análisis de una encuesta de satisfacción del paciente examina la relación entre la situación laboral del paciente y la probabilidad de que el paciente regrese. El primer evento es "Muy probable" y el último evento es "Improbable". La situación laboral puede ser "Desempleado" o "Empleado". El nivel de referencia del predictor, que no se encuentra en la tabla de regresión logística, es "Empleado". La relación de probabilidades es menor que 1, por lo que es más probable que un paciente empleado conteste que es "Muy probable" que regrese en comparación con un paciente desempleado. Las probabilidades de que un paciente desempleado conteste "Muy probable" en lugar de "Algo probable" o "Improbable" son el 53% de las probabilidades de que un paciente empleado conteste "Muy probable". Además, las probabilidades de que un paciente desempleado conteste "Muy probable" o "Algo probable" en lugar de "Improbable" son el 53% de las probabilidades de que un paciente empleado conteste "Muy probable" o "Algo probable".

Información de respuesta

VariableValorConteo
Nueva citaMuy probable19
  Algo probable43
  Improbable11
  Total73

Tabla de regresión logística






Relación de
probabilidades
IC de 95%
PredictorCoefSE CoefZPInferiorSuperior
Const(1)-0.7075120.352815-2.010.045     
Const(2)2.123160.4446724.770.000     
Situación laboral             
  Desempleado-0.6314680.471078-1.340.1800.530.211.34

Nota

Las relaciones de probabilidades utilizan el orden de las categorías, por lo que las relaciones no describen cómo cambian las probabilidades para las categorías que no siguen un orden. Por ejemplo, la relación de probabilidades no describe el cambio en las probabilidades de que el paciente conteste "Algo probable" en lugar de "Muy probable" o "Improbable". Para modelar categorías que tengan un orden arbitrario, utilice la regresión logística nominal.

Intervalo de confianza para la relación de probabilidades (IC de 95%)

Estos intervalos de confianza (IC) son rangos de valores que probablemente contienen los verdaderos valores de las relaciones de probabilidades. El cálculo de los intervalos de confianza utiliza la distribución normal. El intervalo de confianza es exacto si el tamaño de la muestra es lo suficientemente grande como para que la distribución de las relaciones de probabilidades de la muestra siga una distribución normal.

Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si toma muchas muestras aleatorias, un determinado porcentaje de los intervalos de confianza resultantes incluirá el parámetro de población desconocido. El porcentaje de estos intervalos de confianza que contiene el parámetro es el nivel de confianza del intervalo.

El intervalo de confianza consta de las dos partes siguientes:
Estimación de punto
La estimación de punto es la estimación del parámetro que se calcula a partir de los datos de la muestra.
Margen de error
El margen de error define la amplitud del intervalo de confianza y es afectado por el rango de probabilidades del evento, el tamaño de la muestra y el nivel de confianza.

Interpretación

Utilice el intervalo de confianza para evaluar la estimación de la relación de probabilidades.

Por ejemplo, con un nivel de confianza de 95%, usted puede estar 95% seguro de que el intervalo de confianza contiene el valor de la relación de probabilidades para la poblaicón. El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra.

Prueba para términos con más de 1 grado de libertad

Esta prueba es una prueba general que considera todos los coeficientes de un predictor categórico de manera simultánea. La prueba es para los predictores categóricos con más de 2 niveles.

Interpretación

Utilice la prueba para determinar si un predictor categórico con más de 1 coeficiente tiene una relación estadísticamente significativa con los eventos de respuesta. Cuando un predictor categórico tiene más de 2 niveles, los coeficientes de los niveles individuales tienen valores p diferentes. La prueba general proporciona una sola respuesta acerca de si el predictor es estadísticamente significativo.

Para determinar si la asociación entre los eventos de respuesta y el predictor categórico es estadísticamente significativa, compare el valor p de la prueba con su nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que no existe asociación entre el predictor y los eventos de respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el predictor.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el predictor.

Log-verosimilitud

Minitab maximiza la función de log-verosimilitud para encontrar los valores óptimos de los coeficientes estimados.

Interpretación

Utilice la log-verosimilitud para comparar dos modelos que utilizan los mismos datos para estimar los coeficientes. Puesto que los valores son negativos, cuanto más cercano a 0 esté el valor, mejor se ajustará el modelo a los datos.

La log-verosimilitud no puede disminuir cuando se agregan términos a un modelo. Por ejemplo, un modelo con 5 términos tiene una log-verosimilitud mayor que la de cualquier modelo de 4 términos que se pueda crear con los mismos términos. Por lo tanto, la log-verosimilitud es más útil cuando se comparan modelos del mismo tamaño. Para tomar decisiones sobre términos individuales, por lo general se examinan los valores p del término en los diferentes logits.

Probar que todas las pendientes son cero

Esta prueba es una prueba general que considera todos los coeficientes de los predictores incluidos en el modelo.

Interpretación

Utilice la prueba para determinar si al menos uno de los predictores incluidos en el modelo tiene una asociación estadísticamente significativa con los eventos de respuesta. Por lo general, usted no interpreta el estadístico G ni los grados de libertad (GL). Los GL son iguales al número de coeficientes para los predictores incluidos en el modelo.

Para determinar si la asociación entre lo eventos de respuesta y los predictores es estadísticamente significativa, compare el valor p de la prueba con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que todos los coeficientes de los predictores incluidos en el modelo son cero, lo que implica que no existe ninguna asociación entre los eventos de respuesta y cualquiera de los predictores. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y al menos uno de los predictores.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y cualquiera de los términos.