Utilice un diagrama de Pareto de los efectos estandarizados para comparar la magnitud relativa y la significancia estadística de los efectos principales, cuadrados y de interacción.
Minitab grafica los efectos estandarizados colocando sus valores absolutos en orden decreciente. La línea de referencia en la gráfica indica cuáles efectos son significativos. Por opción predeterminada, Minitab utiliza un nivel de significancia de 0.05 para dibujar la línea de referencia.
Término | Coef | EE del coef. | FIV |
---|---|---|---|
Constante | 2.394 | 0.145 | |
Tiemp horneado | 0.7349 | 0.0538 | 1.11 |
Temp hornea 2 | 0.5451 | 0.0541 | 1.20 |
Tiemp horneado*Tiemp horneado | -0.384 | 0.153 | 1.04 |
Tiemp horneado*Temp hornea 2 | -0.5106 | 0.0562 | 1.24 |
En estos resultados, los coeficientes de Tiemp horneado y Temp hornea 2 son números positivos. El coeficiente del término cuadrado de Tiemp horneado y el coeficiente del término de interacción entre Tiemp horneado y Temp hornea 2 son números negativos. Por lo general, los coeficientes positivos hacen que el evento sea más probable y los coeficientes negativos hacen que el evento sea menos probable a medida que el valor del término aumenta.
Fuente | GL | Desv. ajust. | Media ajust. | Chi-cuadrada | Valor p |
---|---|---|---|---|---|
Modelo | 4 | 737.452 | 184.363 | 737.45 | 0.000 |
Tiemp horneado | 1 | 203.236 | 203.236 | 203.24 | 0.000 |
Temp hornea 2 | 1 | 100.432 | 100.432 | 100.43 | 0.000 |
Tiemp horneado*Tiemp horneado | 1 | 6.770 | 6.770 | 6.77 | 0.009 |
Tiemp horneado*Temp hornea 2 | 1 | 80.605 | 80.605 | 80.61 | 0.000 |
Error | 45 | 32.276 | 0.717 | ||
Total | 49 | 769.728 |
En estos resultados, los efectos principales de Tiemp horneado y Temp hornea 2 son estadísticamente significativos en el nivel 0.05. Usted puede concluir que los cambios en estas variables están asociados con los cambios en la variable de respuesta. Debido a que hay términos de orden superior en el modelo, los coeficientes de los efectos principales no describen completamente el efecto de estos factores.
El término cuadrático de Tiemp horneado es significativo. Usted puede concluir que los cambios en esta variable están asociados con los cambios en la variable de respuesta, pero la asociación no es lineal.
El efecto de interacción entre Tiemp horneado y Temp hornea 2 es significativo. Usted puede concluir que el efecto sobre el color de los cambios en Tiemp horneado depende del nivel de Temp hornea 2. De manera equivalente, puede concluir que el efecto sobre el color de los cambios en Temp hornea 2 depende del nivel de Tiemp horneado.
Unidad de cambio | Relación de probabilidades | IC de 95% | |
---|---|---|---|
Tiemp horneado | 2 | * | (*, *) |
Temp hornea 2 | 15 | 2.1653 | (1.9652, 2.3858) |
En estos resultados, el modelo tiene 3 términos para predecir si el color de los pretzels satisface los estándares de calidad: Tiemp horneado, Temp hornea 2 y el término cuadrático de Tiemp horneado. En este ejemplo, un color aceptable es el evento.
La unidad de cambio muestra la diferencia en unidades naturales para una unidad codificada en el diseño. Por ejemplo, en unidades naturales, el nivel bajo de Temp hornea 2 es 127. El nivel alto es 157 grados. La distancia del nivel bajo al punto medio representa un cambio de 1 unidad codificada.. En este caso, esa distancia es 15 grados.
La relación de probabilidades para Temp hornea 2 es aproximadamente 2.17. Por cada 15 grados que la temperatura aumenta, las probabilidades de que el color de un pretzel sea aceptable aumenta en cerca de 2.17 veces.
La relación de probabilidades de Tiemp horneado falta porque el modelo incluye el término cuadrático de Tiemp horneado. La relación de probabilidades no tiene un valor fijo porque el valor depende del valor de Tiemp horneado.
Nivel A | Nivel B | Relación de probabilidades | IC de 95% |
---|---|---|---|
Mes | |||
2 | 1 | 1.1250 | (0.0600, 21.0834) |
3 | 1 | 3.3750 | (0.2897, 39.3165) |
4 | 1 | 7.7143 | (0.7461, 79.7592) |
5 | 1 | 2.2500 | (0.1107, 45.7172) |
6 | 1 | 6.0000 | (0.5322, 67.6397) |
3 | 2 | 3.0000 | (0.2547, 35.3325) |
4 | 2 | 6.8571 | (0.6556, 71.7169) |
5 | 2 | 2.0000 | (0.0976, 41.0019) |
6 | 2 | 5.3333 | (0.4679, 60.7946) |
4 | 3 | 2.2857 | (0.4103, 12.7323) |
5 | 3 | 0.6667 | (0.0514, 8.6389) |
6 | 3 | 1.7778 | (0.2842, 11.1200) |
5 | 4 | 0.2917 | (0.0252, 3.3719) |
6 | 4 | 0.7778 | (0.1464, 4.1326) |
6 | 5 | 2.6667 | (0.2124, 33.4861) |
En estos resultados, el predictor categórico es el mes desde el inicio de la temporada alta de un hotel. La respuesta es si un huésped cancela o no cancela una reservación. En este ejemplo, una cancelación es el evento. La mayor relación de probabilidades es aproximadamente 7,71, cuando el nivel A es el mes 4 y el nivel B es el mes 1. Esto indica que las probabilidades de que un huésped cancele una reservación en el mes 4 son aproximadamente 8 veces mayores que las probabilidades de que un huésped cancele una reservación en el mes 1.
Para determinar qué tan bien se ajusta el modelo a los datos, examine los estadísticos de bondad de ajuste en la tabla Resumen del modelo.
Muchos de los estadísticos de resumen del modelo y de bondad de ajuste se ven afectados por cómo están ordenados los datos en la hoja de trabajo y si hay una prueba por fila o múltiples pruebas por fila. La prueba de Hosmer-Lemeshow no se ve afectada por cómo están ordenados los datos y es comparable entre una prueba por fila y múltiples pruebas por fila. Para obtener más información, vaya a Cómo los formatos de datos afectan la bondad de ajuste en regresión logística binaria.
Mientras más alto sea el valor de R2 de desviación, mejor se ajustará el modelo a los datos. El R2 de desviación siempre se encuentra entre 0% y 100%.
El R2 de desviación siempre se incrementa cuando usted agrega términos adicionales a un modelo. Por ejemplo, el mejor modelo de cinco términos siempre tendrá un R2 de desviación que será al menos tan alto como el mejor modelo de cuatro predictores. Por lo tanto, el R2 de desviación es más útil cuando se comparan modelos del mismo tamaño.
La organización de los datos afecta el valor de R2 de desviación. El R2 de desviación suele ser más alto para datos con múltiples pruebas por fila que para datos con una sola prueba por fila. Los valores de R2 de desviación son comparables solamente entre modelos que utilizan el mismo formato de datos.
Los estadísticos de bondad de ajuste son simplemente una medida de qué tan bien se ajusta el modelo a los datos. Incluso cuando un modelo tenga un valor deseable, usted deberá revisar las gráficas de residuos y las pruebas de bondad de ajuste para evaluar qué tan bien se ajusta un modelo a los datos.
Utilice el R2 de desviación ajustado para comparar modelos que tengan diferentes números de términos. El R2 de desviación siempre se incrementa cuando usted agrega un término al modelo. El valor ajustado de R2 de desviación incorpora el número de términos en el modelo como ayuda para elegir el modelo correcto.
R-cuadrado de la Desviación | R-cuadrado de la Desviación (ajust) | AIC | AICc | BIC |
---|---|---|---|---|
95.81% | 95.16% | 243.85 | 245.80 | 255.32 |
En estos resultados, el modelo explica 95.81% de la desviación total en la variable de respuesta. Para estos datos, el valor de R2 de desviación indica que el modelo proporciona un ajuste adecuado a los datos. Si ajusta otros modelos con diferentes términos, utilice el valor de R2 de desviación ajustado, el valor de AIC, el valor de AICc y el valor de BIC para comparar qué tan bien se ajusta el modelo a los datos.
Si la desviación es estadísticamente significativa, usted puede probar con una función de enlace diferente o cambiar los términos incluidos en el modelo.
Prueba | GL | Chi-cuadrada | Valor p |
---|---|---|---|
Desviación | 44 | 32.26 | 0.905 |
Pearson | 44 | 31.98 | 0.911 |
Hosmer-Lemeshow | 7 | 4.18 | 0.758 |
En estos resultados, todas las pruebas de bondad de ajuste tienen valores p mayores que el nivel de significancia habitual de 0,05. Las pruebas no proporcionan evidencia de que las probabilidades pronosticadas se desvíen de las probabilidades observadas de una manera que la distribución binomial no predice.