Prueba de Wald | |||
---|---|---|---|
Fuente | GL | Chi-cuadrada | Valor p |
Regresión | 1 | 7.83 | 0.005 |
Dosis (mg) | 1 | 7.83 | 0.005 |
Término | Coef | EE del coef. | Valor Z | Valor p | FIV |
---|---|---|---|---|---|
Constante | -5.25 | 1.99 | -2.64 | 0.008 | |
Dosis (mg) | 3.63 | 1.30 | 2.80 | 0.005 | 1.00 |
En estos resultados, la dosis es estadísticamente significativa en el nivel de significancia de 0,05. Usted puede concluir que los cambios en la dosis están asociados a los cambios en la probabilidad de que ocurra el evento.
Evalúe el coeficiente para determinar si un cambio en una variable predictora hace que el evento sea más o menos probable. La relación entre el coeficiente y la probabilidad depende de varios aspectos del análisis, incluyendo la función de enlace. Por lo general, los coeficientes positivos indican que el evento se vuelve más probable a medida que aumenta el predictor. Los coeficientes negativos indican que el evento se vuelve menos probable a medida que aumenta el predictor. Para obtener más información, vaya a Coeficientes y ecuación de regresión para Ajustar modelo logístico binarioy Regresión logística binaria.
El coeficiente de Dosis es 3,63, lo que sugiere que las dosis más altas están asociadas con una mayor probabilidad que ocurra el evento.
Si un término de interacción es estadísticamente significativo, la relación entre un predictor y la respuesta difiere por el nivel del otro predictor. En este caso, usted no debe interpretar los efectos principales sin considerar el efecto de interacción. Para entender mejor los efectos principales, los efectos de interacción y la curvatura del modelo, vaya a Gráficas factoriales y Optimizador de respuestas.
Las relaciones de probabilidades que son mayores que 1 indican que es más probable que el evento ocurra a medida que aumenta el predictor. Las relaciones de probabilidades que son menores que 1 indican que es menos probable que el evento ocurra a medida que aumenta el predictor.
Unidad de cambio | Relación de probabilidades | IC de 95% | |
---|---|---|---|
Dosis (mg) | 0.5 | 6.1279 | (1.7218, 21.8087) |
En estos resultados, el modelo utiliza el nivel de dosificación de un medicamento para predecir la presencia o ausencia de una bacteria en adultos. En este ejemplo, la ausencia de bacterias es el evento. Cada pastilla contiene una dosis de 0.5 mg, por lo que los investigadores utilizan un cambio de una unidad de 0.5 mg. La relación de probabilidades es aproximadamente 6. Por cada pastilla adicional que toma un adulto, las probabilidades de que un paciente no tenga la bacteria aumentan alrededor de 6 veces.
Para los predictores categóricos, la relación de probabilidades compara las probabilidades de que el evento ocurra en 2 niveles diferentes del predictor. Minitab establece la comparación colocando los niveles en 2 columnas: nivel A y nivel B. El nivel B es el nivel de referencia para el factor. Las relaciones de probabilidades que son mayores que 1 indican que el evento es más probable en el nivel A. Las relaciones de probabilidades que son menores que 1 indican que el evento es menos probable en el nivel A. Para obtener información sobre codificación de predictores categóricos, vaya a Esquemas de codificación para predictores categóricos.
Nivel A | Nivel B | Relación de probabilidades | IC de 95% |
---|---|---|---|
Mes | |||
2 | 1 | 1.1250 | (0.0600, 21.0834) |
3 | 1 | 3.3750 | (0.2897, 39.3165) |
4 | 1 | 7.7143 | (0.7461, 79.7592) |
5 | 1 | 2.2500 | (0.1107, 45.7172) |
6 | 1 | 6.0000 | (0.5322, 67.6397) |
3 | 2 | 3.0000 | (0.2547, 35.3325) |
4 | 2 | 6.8571 | (0.6556, 71.7169) |
5 | 2 | 2.0000 | (0.0976, 41.0019) |
6 | 2 | 5.3333 | (0.4679, 60.7946) |
4 | 3 | 2.2857 | (0.4103, 12.7323) |
5 | 3 | 0.6667 | (0.0514, 8.6389) |
6 | 3 | 1.7778 | (0.2842, 11.1200) |
5 | 4 | 0.2917 | (0.0252, 3.3719) |
6 | 4 | 0.7778 | (0.1464, 4.1326) |
6 | 5 | 2.6667 | (0.2124, 33.4861) |
En estos resultados, el predictor categórico es el mes desde el inicio de la temporada alta de un hotel. La respuesta es si un huésped cancela o no cancela una reservación. En este ejemplo, una cancelación es el evento. La mayor relación de probabilidades es aproximadamente 7,71, cuando el nivel A es el mes 4 y el nivel B es el mes 1. Esto indica que las probabilidades de que un huésped cancele una reservación en el mes 4 son aproximadamente 8 veces mayores que las probabilidades de que un huésped cancele una reservación en el mes 1.
Para obtener más información, vaya a Odds ratios para Ajustar modelo logístico binarioy Regresión logística binaria.
Para determinar qué tan bien se ajusta el modelo a los datos, examine los estadísticos de la tabla Resumen del modelo.
Muchos de los estadísticos de resumen del modelo y de bondad de ajuste se ven afectados por cómo están ordenados los datos en la hoja de trabajo y si hay una prueba por fila o múltiples pruebas por fila. La prueba de Hosmer-Lemeshow no se ve afectada por el formato de los datos y es comparable entre formatos. Para obtener más información, vaya a Cómo los formatos de datos afectan la bondad de ajuste en regresión logística binaria.
Mientras más alto sea el R2 de desviación, mejor se ajustará el modelo a los datos. El R2 de desviación siempre se encuentra entre 0% y 100%.
el R2 de desviación siempre se incrementa cuando agrega predictores adicionales a un modelo. Por ejemplo, el mejor modelo de 5 predictores siempre tendrá un R2 que sea al menos tan alto como el mejor modelo de 4 predictores. Por lo tanto, el R2 de desviación es más útil cuando se comparan modelos del mismo tamaño.
Para la regresión logística binaria, el formato de los datos afecta el valor el R2 de desviación. el R2 de desviación generalmente es mayor para los datos en formato Evento/Ensayo. Los valores de R2 de desviación son comparables solamente entre modelos que utilizan el mismo formato de datos.
Los estadísticos de bondad de ajuste son simplemente una medida de qué tan bien se ajusta el modelo a los datos. Incluso cuando un modelo tenga un valor deseable, usted deberá revisar las gráficas de residuos y las pruebas de bondad de ajuste para evaluar qué tan bien se ajusta un modelo a los datos.
Utilice R2 de desviación ajustado para comparar modelos que tengan diferentes números de predictores. El R2 de desviación siempre se incrementa cuando agrega un predictor al modelo. El valor de R2 de desviación ajustado incorpora el número de predictores en el modelo para ayudarle a elegir el modelo correcto.
Utilice el AIC, el AICc y el BIC para comparar diferentes modelos. Para cada estadístico, se prefieren valores más pequeños. Sin embargo, el modelo con el valor más pequeño para un conjunto de predictores no necesariamente ajusta los datos adecuadamente. Utilice también las pruebas de bondad de ajuste y las gráficas de residuos para evaluar hasta qué punto un modelo se ajusta a los datos.
El área bajo los valores de la curva ROC oscila entre 0.5 y 1. Cuando el modelo binario puede separar perfectamente las clases, entonces el área debajo de la curva es 1. Cuando el modelo binario no puede separar las clases mejor que una asignación aleatoria, el área debajo de la curva es 0.5.
R-cuadrado de la Desviación | R-cuadrado de la Desviación (ajust) | AIC | AICc | BIC | Área bajo la curva ROC |
---|---|---|---|---|---|
96.04% | 91.81% | 10.63 | 14.63 | 10.22 | 0.9398 |
En estos resultados, el modelo explica 96.04% de la desviación total en la variable de respuesta. Para estos datos, el valor de R2 de desviación indica que el modelo proporciona un ajuste adecuado a los datos. El área bajo la curva ROC es 0.9398. Este valor indica que el modelo clasifica la mayor parte de los datos correctamente. Si ajusta otros modelos con diferentes predictores, utilice el valor de R2 de desviación ajustado, el valor de AIC, el valor de AICc y el el valor de BIC para comparar qué tan bien ajustan los modelos los datos.
Si la desviación es estadísticamente significativa, usted puede probar con una función de enlace diferente o cambiar los términos incluidos en el modelo.
Para la regresión logística binaria, el formato los datos afecta el valor p debido a que cambia el número de ensayos por fila.
Variable | Valor | Conteo | Nombre del evento |
---|---|---|---|
Evento | Evento | 160 | Evento |
Sin evento | 340 | ||
Ensayo | Total | 500 |
Prueba | GL | Chi-cuadrada | Valor p |
---|---|---|---|
Desviación | 2 | 3.78 | 0.151 |
Pearson | 2 | 3.76 | 0.152 |
Hosmer-Lemeshow | 3 | 3.76 | 0.288 |
En estos resultados, la tabla Información de respuesta muestra Evento y Ensayo en la columna Variable. Estas etiquetas indican que los datos están en el formato de Evento/Ensayo. Todas las pruebas de bondad de ajuste tienen valores p mayores que el nivel de significancia habitual de 0.05. Las pruebas no proporcionan evidencia de que las probabilidades pronosticadas se desvíen de las probabilidades observadas de una manera que la distribución binomial no predice.
Variable | Valor | Conteo | |
---|---|---|---|
Y | Evento | 160 | (Evento) |
Sin evento | 340 | ||
Total | 500 |
Prueba | GL | Chi-cuadrada | Valor p |
---|---|---|---|
Desviación | 497 | 552.03 | 0.044 |
Pearson | 497 | 504.42 | 0.399 |
Hosmer-Lemeshow | 3 | 3.76 | 0.288 |
En estos resultados para los mismos datos, la tabla Información de respuesta muestra Y en la columna Variable. Esta etiqueta indica que los datos están en un formato de respuesta binaria/frecuencia. La prueba de desviación tiene un valor p menor que el nivel de significancia habitual de 0.05, pero la prueba de Hosmer-Lemeshow es la prueba más fiable. La prueba de Hosmer-Lemeshow no proporciona evidencia de que las probabilidades pronosticadas se desvíen de las probabilidades observadas de una manera que la distribución binomial no predice.
Los trazados de contorno superpuestos están disponibles cuando se ajusta un modelo en el Estadísticas menú.