Interpretar los resultados clave para Gráfica de línea ajustada binaria

Complete los siguientes pasos para interpretar una gráfica de línea ajustada binaria. La salida clave incluye el valor p, la gráfica de línea ajustada, el R2 de desviación y la gráfica de residuos.

Paso 1: Determinar si la asociación entre la respuesta y la variable predictora es estadísticamente significativa

Para determinar si la asociación entre la variable de respuesta y la variable predictora es estadísticamente significativa, compare el valor p del término con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que el coeficiente de la variable predictora es igual a cero, lo que indica que no hay asociación entre la variable predictora y la variable de respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0,05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y la variable predictora.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y la variable predictora.

Análisis de Varianza

FuenteGLDesv. ajust.Media ajust.Chi-cuadradaValor p
Regresión122.705222.705222.710.000
  Dosis (mg)122.705222.705222.710.000
Error40.93730.2343   
Total523.6425     
Resultado clave: Valor p

En estos resultados, el valor p de dosis es 0.000, que es menor que el nivel de significancia de 0.05. Estos resultados indican que la asociación entre la dosis y la presencia de bacterias al final del tratamiento es estadísticamente significativa.

Paso 2: Entender los efectos de los predictores

Utilice la relación de probabilidades para entender el efecto de un predictor. Minitab calcula las relaciones de probabilidades cuando el modelo utiliza la función de enlace logit.

Las relaciones de probabilidades que son mayores que 1 indican que es más probable que el evento ocurra a medida que aumenta el predictor. Las relaciones de probabilidades que son menores que 1 indican que es menos probable que el evento ocurra a medida que aumenta el predictor.

Relaciones de probabilidades para predictores continuos

Unidad
de
cambio
Relación de
probabilidades
IC de 95%
Dosis (mg)0.56.1279(1.7218, 21.8087)
Resultado clave: Relación de probabilidades

En estos resultados, el modelo utiliza el nivel de dosificación de un medicamento para predecir la presencia o ausencia de una bacteria en adultos. Cada pastilla contiene una dosis de 0.5 mg, por lo que los investigadores utilizan un cambio de una unidad de 0.5 mg. La relación de probabilidades es aproximadamente 6. Por cada pastilla adicional que toma un adulto, las probabilidades de que un paciente no tenga la bacteria aumentan alrededor de 6 veces.

Utilice la gráfica de línea ajustada para examinar la relación entre la variable de respuesta y la variable predictora.

Resultado clave: Gráfica de línea ajustada binaria

En estos resultados, la ecuación se escribe como la probabilidad de un éxito. El valor de respuesta de 1 en el eje Y representa un éxito. La gráfica muestra que la probabilidad de éxito disminuye a medida que la temperatura se incrementa. Cuando las temperaturas en los datos están cerca de 50, la pendiente de la línea no es muy abrupta, lo cual indica que la probabilidad de que disminuye lentamente a medida que la temperatura se incrementa. La línea es más inclinada en la porción media de los datos de temperatura, lo cual indica que un cambio de un grado en la temperatura tiene un efecto más grande en este rango. Cuando la probabilidad de éxito se aproxima a cero en el extremo alto del rango de temperatura, la línea se aplana de nuevo.

Paso 3: Determinar qué tan bien se ajusta el modelo a los datos

Para determinar qué tan bien se ajusta el modelo a los datos, examine los estadísticos de la tabla Resumen del modelo. Para la regresión logística binaria, el formato de los datos afecta el estadístico R2 de desviación, pero no el AIC. Para obtener más información, vaya a Cómo los formatos de datos afectan la bondad de ajuste en regresión logística binaria.

R-cuad. de desviación

Mientras más alta sea la desviación R2, mejor se ajustará el modelo a los datos. La desviación de R2 siempre se encuentra entre 0% y 100%.

La desviación de R2 siempre se incrementa cuando agrega predictores adicionales a un modelo. Por ejemplo, el mejor modelo de 5 predictores siempre tendrá un R2 que sea al menos tan alto como el mejor modelo de 4 predictores. Por lo tanto, la desviación de R2 es más útil cuando se comparan modelos del mismo tamaño.

Para la regresión logística binaria, el formato de los datos afecta el valor de la desviación de R2. La desviación de R2 generalmente es mayor para los datos en formato Event/Trial. Los valores de la desviación de R2 son comparables solamente entre modelos que utilizan el mismo formato de datos.

El R2 de desviación es solo una medida de qué tan bien se ajusta el modelo a los datos. Aun cuando un modelo tenga un R2 alto, se debe examinar la gráfica de residuos para evaluar qué tan bien se ajusta el modelo a los datos.

R-cuad. (ajust.) de desviación

Utilice la desviación de R2 ajustado para comparar modelos que tengan diferentes números de predictores. La desviación de R2 siempre se incrementa cuando agrega un predictor al modelo. El valor de la desviación de R2 incorpora el número de predictores en el modelo para ayudarle a elegir el modelo correcto.

AIC, AICc y BIC
Para Gráfica de línea ajustada binaria, usted puede utilizar el criterio de información para comparar el ajuste de diferentes funciones de enlace o diferentes predictores. Se prefieren valores más pequeños. Sin embargo, el modelo con el valor más pequeño no necesariamente se ajusta a los datos de forma adecuada. Use también pruebas y gráficas de residuos para evaluar qué tan bien se ajusta el modelo a los datos.

Resumen del modelo

R-cuadrado
de la
Desviación
R-cuadrado de
la Desviación
(ajust)
AICAICcBICÁrea bajo
la curva
ROC
96.04%91.81%10.6314.6310.220.9398
Resultados clave: R-cuad. de desviación, R-cuad.(ajust) de desviación, AIC

En estos resultados, el modelo explica 96.04% de la desviación en la variable de respuesta. Para estos datos, el valor de R2 de desviación indica que el modelo proporciona un ajuste adecuado a los datos. Si se ajustan modelos adicionales con diferentes predictores, utilice los otros valores para comparar hasta qué punto el modelo se ajusta a los datos.

Paso 4: Determinar si el modelo cumple con los supuestos del análisis

Utilice las gráficas de residuos como ayuda para determinar si el modelo es adecuado y cumple con los supuestos del análisis. Si los supuestos no se cumplen, el modelo podría no ajustarse adecuadamente a los datos y se debería tener cuidado al interpretar los resultados.

Para obtener más información sobre cómo manejar los patrones en las gráficas de residuos, vaya a Gráficas para Gráfica de línea ajustada binaria y haga clic en el nombre de la gráfica de residuos en la lista que se encuentra en la parte superior de la página.

Gráfica de residuos vs. ajustes

Utilice la gráfica de residuos vs. ajustes para verificar el supuesto de que los residuos están distribuidos aleatoriamente. Lo ideal es que los puntos se ubiquen aleatoriamente a ambos lados del 0, con patrones no detectables en los puntos.

La gráfica de residuos vs. ajustes solo está disponible cuando los datos están en el formato de Evento/Ensayo.

Los patrones que se observan en la siguiente tabla podrían indicar que el modelo no cumple con los supuestos del modelo.
Patrón Lo que podría indicar el patrón
Dispersión en abanico o irregular de los residuos en los valores ajustados Una función de enlace inapropiada
Curvilíneo Un término de orden superior faltante o una función de enlace inapropiada
Un punto que está alejado de cero Un valor atípico
Un punto que está lejos de los otros puntos en la dirección x Un punto influyente
En esta gráfica de residuos vs. ajustes, los datos parecen estar distribuidos aleatoriamente alrededor de cero. No existe evidencia de que el valor del residuo depende del valor ajustado.

Gráfica de residuos vs. orden

Utilice la gráfica de residuos vs. orden para verificar el supuesto de que los residuos son independientes entre sí. Los residuos independientes no muestran tendencias ni patrones cuando se muestran en orden cronológico. Los patrones en los puntos podrían indicar que los residuos que están cercanos entre sí podrían estar correlacionados y, por lo tanto, podrían no ser independientes. Lo ideal es que los residuos que se muestran en la gráfica se ubiquen aleatoriamente alrededor de la línea central:
Si observa un patrón, investigue la causa. Los siguientes tipos de patrones pueden indicar que los residuos son dependientes.
Tendencia
Cambio
Ciclo
En esta gráfica de residuos vs. orden, los residuos parecen estar distribuidos aleatoriamente alrededor de la línea central. No existe evidencia de que los residuos no son independientes.