Interpretar los resultados clave para Analizar diseño de mezcla

Complete los siguientes pasos para analizar un diseño de mezcla. La salida clave incluye los valores p, los coeficientes, los estadísticos de resumen del modelo y las gráficas de residuos.

Paso 1: Determinar si la asociación entre la respuesta y el término es estadísticamente significativa

Para determinar si la asociación entre la respuesta y cada término incluido en el modelo es estadísticamente significativa, compare el valor p del término con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que no hay asociación entre el término y la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el término.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que existe una asociación estadísticamente significativa entre la variable de respuesta y el término. Le convendría volver a ajustar el modelo sin el término.
Si hay múltiples predictores sin una asociación estadísticamente significativa con la respuesta, usted puede reducir el modelo eliminando términos uno a la vez. Para obtener más información sobre cómo eliminar términos del modelo, vaya a Reducción del modelo.

Minitab no muestra los valores p para los términos lineales de los componentes en los experimentos de mezclas debido a la dependencia entre los componentes. Específicamente, porque los componentes deben sumar una cantidad fija o una proporción total de 1 y si se cambia un solo componente, se fuerza un cambio en los otros. Además, el modelo para un experimento de mezclas no incluye una constante, porque esta se incorpora a los términos lineales.

Si un término de interacción es estadísticamente significativo, la interpretación depende de los tipos de términos incluidos de la interacción. Las interpretaciones son las siguientes:
  • Los términos de interacción que solo incluyen componentes indican que la asociación entre la mezcla de componentes y la respuesta es estadísticamente significativa.
    • Los coeficientes positivos de los términos de interacción indican que los componentes de la mezcla actúan de forma sinérgica. Es decir, el valor de la respuesta media es mayor que el valor que se obtendría al calcular la media simple de la variable de respuesta para cada mezcla pura.
    • Los coeficientes negativos de los términos de interacción indican que los componentes de la mezcla actúan de forma antagónica. Es decir, el valor de la respuesta media es menor que el valor que se obtendría al calcular la media simple de la variable de respuesta para cada mezcla pura.
  • Los términos de interacción que incluyen componentes y las variables de proceso indican que el efecto de los componentes sobre la variable respuesta depende de las variables de proceso.
Sugerencia

Para explorar aún más las relaciones de los componentes y las variables de proceso con la respuesta, utilice Gráfica de contorno, Gráfica de superficie y Gráfica de trazas de respuesta.

Coeficientes de regresión estimados para Sabor (proporciones del componente)

TérminoCoefEE del coef.Valor TValor pFIV
Emmenthaler104.8740.667**15.94
Gruyere175.085.89**203.46
Caldo-8.8100.659**26.04
Emmenthaler*Gruyere59.210.35.750.00057.33
Gruyere*Caldo30.049.003.340.008109.44
Emmenthaler*Temperatura4.5000.4759.480.0008.09
Gruyere*Temperatura4.5000.6796.620.0002.71
Caldo*Temperatura4.5000.44310.160.00011.76
Los coeficientes se calculan para las variables de proceso codificadas.
Resultados clave: Valor p, coeficientes

Todos los términos de interacción tienen valores p que son menores que el nivel de significancia de 0.05.

Los coeficientes positivos de los términos de interacción con dos componentes indican que las mezclas de dos componentes actúan de forma sinérgica. La puntuación media de sabor de cada mezcla es mayor que la que se obtendría al calcular la media simple de las dos puntuaciones de sabor para cada mezcla pura.

Además, la interacción entre los ingredientes y la variable de proceso, temperatura, indica que la puntuación de sabor de la mezcla depende de la temperatura al servirla.

Paso 2: Determinar qué tan bien se ajusta el modelo a los datos

Para determinar qué tan bien se ajusta el modelo a los datos, examine los estadísticos de bondad de ajuste en la tabla Resumen del modelo.

S

Utilice S para evaluar qué tan bien el modelo describe la respuesta. Utilice S en lugar de los estadísticos R2 para comparar el ajuste de los modelos que no tienen una constante.

S se mide en las unidades de la variable de respuesta y representa la distancia que separa a los valores de los datos de los valores ajustados. Mientras más bajo sea el valor de S, mejor describirá el modelo la respuesta. Sin embargo, un valor de S bajo no indica por sí solo que el modelo cumple con los supuestos del modelo. Debe examinar las gráficas de residuos para verificar los supuestos.

R-cuad.

Mientras mayor sea el valor de R2, mejor se ajustará el modelo a los datos. R2 siempre está entre 0% y 100%.

R2 siempre aumenta cuando se agregan más predictores a un modelo. Por ejemplo, el mejor modelo de cinco predictores siempre tendrá un R2 que será al menos tan alto como el mejor modelo de cuatro predictores. Por lo tanto, R2 es más útil cuando se comparan modelos del mismo tamaño.

R-cuad. (ajust)

Utilice R2 ajustado cuando desee comparar modelos que tengan diferentes números de predictores. R2 siempre aumenta cuando se agrega un predictor al modelo, incluso cuando no haya una mejora real en el modelo. El valor de R2 ajustado incorpora el número de predictores del modelo para ayudar a elegir el modelo correcto.

R-cuad.(pred)

Utilice R2 pronosticado para determinar qué tan bien el modelo predice la respuesta para nuevas observaciones. Los modelos que tienen valores más grandes de R2 pronosticado tienen mejor capacidad de predicción.

Un R2 pronosticado que sea sustancialmente menor que R2 puede indicar que el modelo está sobreajustado. Un modelo sobreajustado se produce cuando se agregan términos para efectos que no son importantes en la población. El modelo se adapta a los datos de la muestra y, por lo tanto, es posible que no sea útil para hacer predicciones acerca de la población.

R2 pronosticado también puede ser más útil que R2 ajustado para comparar modelos, porque se calcula con observaciones que no se incluyen en el cálculo del modelo.

Considere los siguientes puntos cuando interprete los valores de R2:
  • Las muestras pequeñas no proporcionan una estimación precisa de la fuerza de la relación entre la respuesta y los predictores. Si necesita que R2 sea más preciso, debe utilizar una muestra más grande (generalmente, 40 o más).
  • R2 simplemente es una medida de qué tan bien se ajusta el modelo a los datos. Incluso cuando un modelo tenga un R2 alto, usted deberá revisar las gráficas de residuos para verificar que el modelo cumpla con los supuestos del modelo.

Resumen del modelo

SR-cuadradoR-cuadrado(ajustado)PRESSR-cuadrado
(pred)
0.27696099.98%99.97%2.6532299.93%
Resultados clave: S, R-cuad., R-cuad.(ajust), R-cuad.(pred)

En estos resultados, el modelo explica un 99.98% de la variación en la puntuación de sabor. Para estos datos, el valor de R2 indica que el modelo ofrece un ajuste adecuado a los datos. Si se ajustan modelos adicionales con diferentes predictores, utilice los valores de R2 ajustado y los valores de R2 pronosticado para comparar qué tan bien se ajustan los modelos a los datos.

Paso 3: Determinar si el modelo cumple con los supuestos del análisis

Utilice las gráficas de residuos como ayuda para determinar si el modelo es adecuado y cumple con los supuestos del análisis. Si los supuestos no se cumplen, es posible que el modelo no se ajuste adecuadamente a los datos y deberá tener precaución al interpretar los resultados.

Para obtener más información sobre cómo manejar los patrones en las gráficas de residuos, vaya a Gráficas de residuos para Analizar diseño de mezcla y haga clic en el nombre de la gráfica de residuos en la lista que se encuentra en la parte superior de la página.

Gráfica de residuos vs. ajustes

Los patrones que se observan en la siguiente tabla podrían indicar que el modelo no cumple con los supuestos del modelo.
Patrón Lo que podría indicar el patrón
Dispersión en abanico o irregular de los residuos en los valores ajustados Varianza no constante
Curvilíneo Un término de orden superior faltante
Un punto que está alejado de cero Un valor atípico
Un punto que está lejos de los otros puntos en la dirección x Un punto influyente

Utilice la gráfica de residuos vs. ajustes para verificar el supuesto de que los residuos están distribuidos aleatoriamente y tienen una varianza constante. Lo ideal es que los puntos se ubiquen aleatoriamente a ambos lados del 0, sin patrones detectables en los puntos.

Gráfica de residuos vs. orden

Utilice la gráfica de residuos vs. orden para verificar el supuesto de que los residuos son independientes entre sí. Los residuos independientes no muestran tendencias ni patrones cuando se muestran en orden cronológico. Los patrones en los puntos podrían indicar que los residuos que están cercanos entre sí podrían estar correlacionados y, por lo tanto, podrían no ser independientes. Lo ideal es que los residuos que se muestran en la gráfica se ubiquen aleatoriamente alrededor de la línea central:
Si observa un patrón, investigue la causa. Los siguientes tipos de patrones pueden indicar que los residuos son dependientes.
Tendencia
Cambio
Ciclo

Gráfica de probabilidad normal de los residuos

Utilice la gráfica de probabilidad normal de los residuos para verificar el supuesto de que los residuos están distribuidos normalmente. La gráfica de probabilidad normal de los residuos debe seguir aproximadamente una línea recta.

Los patrones que se observan en la siguiente tabla podrían indicar que el modelo no cumple con los supuestos del modelo.

Patrón Lo que podría indicar el patrón
No una línea recta No normalidad
Un punto que está alejado de la línea Un valor atípico
Cambio de pendiente Una variable no identificada