Relaciones de probabilidades para Ajustar modelo logístico binario

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos incluidos en las tablas Relación de probabilidades.

Relación de probabilidades

La relación de probabilidades compara las probabilidades de dos eventos. Las probabilidades de un evento son la probabilidad de que el evento ocurra dividida entre la probabilidad de que el evento no ocurra. Minitab calcula las relaciones de probabilidades cuando el modelo utiliza la función de enlace logit.

Interpretación

Utilice la relación de probabilidades para entender el efecto de un predictor. La interpretación de la relación de probabilidades depende de si el predictor es categórico o continuo.

Relaciones de probabilidades para predictores continuos

Las relaciones de probabilidades que son mayores que 1 indican que es más probable que el evento ocurra a medida que aumenta el predictor. Las relaciones de probabilidades que son menores que 1 indican que es menos probable que el evento ocurra a medida que aumenta el predictor.

En estos resultados, el modelo utiliza el nivel de dosificación de un medicamento para predecir la presencia o ausencia de una bacteria en adultos. En este ejemplo, la ausencia de bacterias es el evento. Cada pastilla contiene una dosis de 0.5 mg, por lo que los investigadores utilizan un cambio de una unidad de 0.5 mg. La relación de probabilidades es aproximadamente 6. Por cada pastilla adicional que toma un adulto, las probabilidades de que un paciente no tenga la bacteria aumentan alrededor de 6 veces.

Relaciones de probabilidades para predictores continuos

Unidad
de
cambio
Relación de
probabilidades
IC de 95%
Dosis (mg)0.56.1279(1.7218, 21.8087)
Relaciones de probabilidades para predictores categóricos

Para los predictores categóricos, la relación de probabilidades compara las probabilidades de que el evento ocurra en 2 niveles diferentes del predictor. Minitab establece la comparación colocando los niveles en 2 columnas: nivel A y nivel B. El nivel B es el nivel de referencia para el factor. Las relaciones de probabilidades que son mayores que 1 indican que el evento es más probable en el nivel A. Las relaciones de probabilidades que son menores que 1 indican que el evento es menos probable en el nivel A. Para obtener información sobre codificación de predictores categóricos, vaya a Esquemas de codificación para predictores categóricos.

En estos resultados, el predictor categórico es el mes desde el inicio de la temporada alta de un hotel. La respuesta es si un huésped cancela o no cancela una reservación. En este ejemplo, una cancelación es el evento. La mayor relación de probabilidades es aproximadamente 7,71, cuando el nivel A es el mes 4 y el nivel B es el mes 1. Esto indica que las probabilidades de que un huésped cancele una reservación en el mes 4 son aproximadamente 8 veces mayores que las probabilidades de que un huésped cancele una reservación en el mes 1.

Regresión logística binaria: Cancellation vs. Mes

Relaciones de probabilidades para predictores categóricos

Nivel ANivel BRelación de
probabilidades
IC de 95%
Mes     
  211.1250(0.0600, 21.0834)
  313.3750(0.2897, 39.3165)
  417.7143(0.7461, 79.7592)
  512.2500(0.1107, 45.7172)
  616.0000(0.5322, 67.6397)
  323.0000(0.2547, 35.3325)
  426.8571(0.6556, 71.7169)
  522.0000(0.0976, 41.0019)
  625.3333(0.4679, 60.7946)
  432.2857(0.4103, 12.7323)
  530.6667(0.0514, 8.6389)
  631.7778(0.2842, 11.1200)
  540.2917(0.0252, 3.3719)
  640.7778(0.1464, 4.1326)
  652.6667(0.2124, 33.4861)
Relación de probabilidades para nivel A relativo a nivel B

Intervalo de confianza para la relación de probabilidades (IC de 95%)

Estos intervalos de confianza (IC) son rangos de valores que probablemente contienen los verdaderos valores de las relaciones de probabilidades. El cálculo de los intervalos de confianza utiliza la distribución normal. El intervalo de confianza es exacto si el tamaño de la muestra es lo suficientemente grande como para que la distribución de las relaciones de probabilidades de la muestra siga una distribución normal.

Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si toma muchas muestras aleatorias, un determinado porcentaje de los intervalos de confianza resultantes incluirá el parámetro de población desconocido. El porcentaje de estos intervalos de confianza que contiene el parámetro es el nivel de confianza del intervalo.

El intervalo de confianza consta de las dos partes siguientes:
Estimación de punto
La estimación de punto es la estimación del parámetro que se calcula a partir de los datos de la muestra.
Margen de error
El margen de error define la amplitud del intervalo de confianza y es afectado por el rango de probabilidades del evento, el tamaño de la muestra y el nivel de confianza.

Interpretación

Utilice el intervalo de confianza para evaluar la estimación de la relación de probabilidades.

Por ejemplo, con un nivel de confianza de 95%, usted puede estar 95% seguro de que el intervalo de confianza contiene el valor de la relación de probabilidades para la poblaicón. El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra.