Utilice un diagrama de Pareto de los efectos estandarizados para comparar la magnitud relativa y la significancia estadística de los efectos principales, cuadrados y de interacción.
Minitab grafica los efectos estandarizados colocando sus valores absolutos en orden decreciente. La línea de referencia en la gráfica indica cuáles efectos son significativos. Por opción predeterminada, Minitab utiliza un nivel de significancia de 0.05 para dibujar la línea de referencia.
Para determinar si la asociación entre la respuesta y cada término en el modelo es estadísticamente significativa, compare el valor p del término con su nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que el coeficiente del término es igual a cero, lo que implica que no hay asociación entre el término y la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0,05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Término | Coef | EE del coef. | FIV |
---|---|---|---|
Constante | 3.021 | 0.384 | |
Tiempo | 0.210 | 0.139 | 18.53 |
Temperatura | 0.641 | 0.159 | 19.53 |
Presión | 0.420 | 0.211 | 70.48 |
Tiempo*Tiempo | -0.0735 | 0.0482 | 1.01 |
Temperatura*Temperatura | 0.2988 | 0.0517 | 1.17 |
Presión*Presión | -0.0022 | 0.0277 | 70.24 |
Tiempo*Temperatura | -0.0092 | 0.0505 | 1.14 |
Tiempo*Presión | 0.0417 | 0.0342 | 18.12 |
Temperatura*Presión | -0.0521 | 0.0396 | 19.24 |
En estos resultados, los coeficientes de los efectos principales de Tiempo, Temperatura y Presión son números positivos. El coeficiente del término cuadrático de Tiempo*Tiempo es un número negativo. Por lo general, los coeficientes positivos hacen que el evento sea más probable y los coeficientes negativos hacen que el evento sea menos probable a medida que el valor del término aumenta.
Fuente | GL | Desv. ajust. | Media ajust. | Chi-cuadrada | Valor p |
---|---|---|---|---|---|
Modelo | 9 | 903.478 | 100.386 | 903.48 | 0.000 |
Tiempo | 1 | 2.303 | 2.303 | 2.30 | 0.129 |
Temperatura | 1 | 16.388 | 16.388 | 16.39 | 0.000 |
Presión | 1 | 3.966 | 3.966 | 3.97 | 0.046 |
Tiempo*Tiempo | 1 | 2.331 | 2.331 | 2.33 | 0.127 |
Temperatura*Temperatura | 1 | 34.012 | 34.012 | 34.01 | 0.000 |
Presión*Presión | 1 | 0.006 | 0.006 | 0.01 | 0.937 |
Tiempo*Temperatura | 1 | 0.033 | 0.033 | 0.03 | 0.856 |
Tiempo*Presión | 1 | 1.490 | 1.490 | 1.49 | 0.222 |
Temperatura*Presión | 1 | 1.731 | 1.731 | 1.73 | 0.188 |
Error | 5 | 23.404 | 4.681 | ||
Total | 14 | 926.882 |
En estos resultados, el término cuadrático de Temperatura*Temperatura y los efectos principales de Temperatura y Presión son significativos en el nivel de significancia α = 0.05.
Las relaciones de probabilidades que son mayores que 1 indican que es más probable que el evento ocurra a medida que aumenta el predictor. Las relaciones de probabilidades que son menores que 1 indican que es menos probable que el evento ocurra a medida que aumenta el predictor.
Unidad de cambio | Relación de probabilidades | IC de 95% | |
---|---|---|---|
Dosis (mg) | 0.5 | 6.1279 | (1.7218, 21.8087) |
En estos resultados, el modelo utiliza el nivel de dosificación de un medicamento para predecir la presencia o ausencia de una bacteria en adultos. En este ejemplo, la ausencia de bacterias es el evento. Cada pastilla contiene una dosis de 0.5 mg, por lo que los investigadores utilizan un cambio de una unidad de 0.5 mg. La relación de probabilidades es aproximadamente 6. Por cada pastilla adicional que toma un adulto, las probabilidades de que un paciente no tenga la bacteria aumentan alrededor de 6 veces.
Para los predictores categóricos, la relación de probabilidades compara las probabilidades de que el evento ocurra en 2 niveles diferentes del predictor. Minitab establece la comparación colocando los niveles en 2 columnas: nivel A y nivel B. El nivel B es el nivel de referencia para el factor. Las relaciones de probabilidades que son mayores que 1 indican que el evento es más probable en el nivel A. Las relaciones de probabilidades que son menores que 1 indican que el evento es menos probable en el nivel A. Para obtener información sobre codificación de predictores categóricos, vaya a Esquemas de codificación para predictores categóricos.
Nivel A | Nivel B | Relación de probabilidades | IC de 95% |
---|---|---|---|
Mes | |||
2 | 1 | 1.1250 | (0.0600, 21.0834) |
3 | 1 | 3.3750 | (0.2897, 39.3165) |
4 | 1 | 7.7143 | (0.7461, 79.7592) |
5 | 1 | 2.2500 | (0.1107, 45.7172) |
6 | 1 | 6.0000 | (0.5322, 67.6397) |
3 | 2 | 3.0000 | (0.2547, 35.3325) |
4 | 2 | 6.8571 | (0.6556, 71.7169) |
5 | 2 | 2.0000 | (0.0976, 41.0019) |
6 | 2 | 5.3333 | (0.4679, 60.7946) |
4 | 3 | 2.2857 | (0.4103, 12.7323) |
5 | 3 | 0.6667 | (0.0514, 8.6389) |
6 | 3 | 1.7778 | (0.2842, 11.1200) |
5 | 4 | 0.2917 | (0.0252, 3.3719) |
6 | 4 | 0.7778 | (0.1464, 4.1326) |
6 | 5 | 2.6667 | (0.2124, 33.4861) |
En estos resultados, el predictor categórico es el mes desde el inicio de la temporada alta de un hotel. La respuesta es si un huésped cancela o no cancela una reservación. En este ejemplo, una cancelación es el evento. La mayor relación de probabilidades es aproximadamente 7,71, cuando el nivel A es el mes 4 y el nivel B es el mes 1. Esto indica que las probabilidades de que un huésped cancele una reservación en el mes 4 son aproximadamente 8 veces mayores que las probabilidades de que un huésped cancele una reservación en el mes 1.
Muchos de los estadísticos de resumen del modelo y de bondad de ajuste se ven afectados por cómo están ordenados los datos en la hoja de trabajo y si hay una prueba por fila o múltiples pruebas por fila. La prueba de Hosmer-Lemeshow no se ve afectada por cómo están ordenados los datos y es comparable entre una prueba por fila y múltiples pruebas por fila. Para obtener más información, vaya a Cómo los formatos de datos afectan la bondad de ajuste en regresión logística binaria.
Mientras más alta sea la desviación R2, mejor se ajustará el modelo a los datos. La desviación de R2 siempre se encuentra entre 0% y 100%.
El R2 de desviación siempre se incrementa cuando usted agrega términos adicionales a un modelo. Por ejemplo, el mejor modelo de 5 términos siempre tendrá un R2 que sea al menos tan alto como el mejor modelo de 4 modelos. Por lo tanto, el R2 de desviación es más útil cuando se comparan modelos del mismo tamaño.
La organización de los datos afecta el valor de R2 de desviación. El R2 de desviación suele ser más alto para datos con múltiples pruebas por fila que para datos con una sola prueba por fila. Los valores de R2 de desviación son comparables solamente entre modelos que utilizan el mismo formato de datos.
Los estadísticos de bondad de ajuste son simplemente una medida de qué tan bien se ajusta el modelo a los datos. Incluso cuando un modelo tenga un valor deseable, usted deberá revisar las gráficas de residuos y las pruebas de bondad de ajuste para evaluar qué tan bien se ajusta un modelo a los datos.
Utilice el R2 de desviación ajustado para comparar modelos que tengan diferentes números de términos. El R2 de desviación siempre se incrementa cuando usted agrega un término al modelo. El valor ajustado de R2 de desviación incorpora el número de términos en el modelo como ayuda para elegir el modelo correcto.
Utilice el AIC, el AICc y el BIC para comparar diferentes modelos. Para cada estadístico, se prefieren valores más pequeños. Sin embargo, el modelo con el valor más pequeño para un conjunto de predictores no necesariamente ajusta los datos adecuadamente. Utilice también las pruebas de bondad de ajuste y las gráficas de residuos para evaluar hasta qué punto un modelo se ajusta a los datos.
R-cuadrado de la Desviación | R-cuadrado de la Desviación (ajust) | AIC | AICc | BIC |
---|---|---|---|---|
97.95% | 76.75% | 105.98 | 171.98 | 114.48 |
En estos resultados, el modelo explica 97.95% de la desviación total en la variable de respuesta. Para estos datos, el valor de R2 de desviación indica que el modelo proporciona un ajuste adecuado a los datos. Si ajusta otros modelos con diferentes predictores, utilice el valor ajustado de R2 de desviación, el valor de AIC, el valor de AICc y el valor de BIC para comparar qué tan bien se ajustan los modelos a los datos.
Si la desviación es estadísticamente significativa, usted puede probar con una función de enlace diferente o cambiar los términos incluidos en el modelo.
Variable | Valor | Conteo | Nombre del evento |
---|---|---|---|
Deterioro | Evento | 506 | Event |
Sin evento | 7482 | ||
Contenedores | Total | 7988 |
Prueba | GL | Chi-cuadrada | Valor p |
---|---|---|---|
Desviación | 5 | 0.97 | 0.965 |
Pearson | 5 | 0.97 | 0.965 |
Hosmer-Lemeshow | 6 | 0.10 | 1.000 |
En estos resultados, todas las pruebas de bondad de ajuste tienen valores p mayores que el nivel de significancia habitual de 0,05. Las pruebas no proporcionan evidencia de que las probabilidades pronosticadas se desvíen de las probabilidades observadas de una manera que la distribución binomial no predice.