Interpretar los resultados clave para la Analizar diseño de superficie de respuesta

Realice los siguientes pasos para interpretar un diseño factorial. La salida clave incluye los valores p, los coeficientes, el R2 y las gráficas de residuos.

Paso 1: Determinar cuáles términos contribuyen más a la variabilidad en la respuesta

Utilice un diagrama de Pareto de los efectos estandarizados para comparar la magnitud relativa y la significancia estadística de los efectos principales, cuadráticos y de interacción. Si el modelo incluye un término de error, el diagrama muestra el valor absoluto de los efectos estandarizados. Si el modelo no incluye un término de error, Minitab no crea un diagrama de Pareto.

Minitab grafica los efectos estandarizados colocando sus valores absolutos en orden decreciente. La línea de referencia en la gráfica indica cuáles efectos son significativos. Por opción predeterminada, Minitab utiliza un nivel de significancia de 0.05 para dibujar la línea de referencia.

Resultados clave: Diagrama de Pareto

En estos resultados, la interacción entre la temperatura de la barra caliente y el tiempo de permanencia (AB) y los términos cuadráticos de la temperatura de la barra caliente (AA) y el tiempo de permanencia (BB) son significativos en el nivel de significancia α = 0.05.

Además, usted puede observar que el efecto más grande es la temperatura de la barra caliente y el tiempo de permanencia (AB), porque es el que más se extiende. La temperatura de la barra caliente y la presión de la barra caliente (AC) es el efecto más pequeño porque es el que menos se extiende.

Paso 2: Determinar si la asociación entre la respuesta y el término es estadísticamente significativa

Para determinar si la asociación entre la respuesta y cada término en el modelo es estadísticamente significativa, compare el valor p del término con su nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que el coeficiente del término es igual a cero, lo que implica que no hay asociación entre el término y la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0,05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.

Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el término.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que existe una asociación estadísticamente significativa entre la variable de respuesta y el término. Le convendría reajustar el modelo sin el término.
Si hay múltiples predictores sin una asociación estadísticamente significativa con la respuesta, usted puede reducir el modelo eliminando términos uno a la vez. Para obtener más información sobre cómo eliminar términos del modelo, vaya a Reducción del modelo.

Si un término del modelo es estadísticamente significativo, la interpretación depende del tipo de término. Las interpretaciones son las siguientes:

  • Si un coeficiente de un factor es estadísticamente significativo, usted puede concluir que no todas las medias de nivel son iguales.
  • Si un coeficiente de un término cuadrado es significativo, usted puede concluir que la relación entre el factor y la respuesta sigue una línea curva.
  • Si un coeficiente de un término de interacción es significativo, la relación entre un factor y la respuesta depende del resto de los factores en el término. En este caso, usted no debe interpretar los efectos principales sin considerar el efecto de interacción.
Resultados clave: Valor p, coeficientes

En estos resultados, el término cuadrado de la temperatura de la barra caliente y el tiempo de permanencia y la interacción entre la temperatura de la barra caliente y el tiempo de permanencia son significativos en el nivel de significancia α = 0.05.

Análisis de Varianza

FuenteGLSC Ajust.MC Ajust.Valor FValor p
Modelo141137.5181.2514.190.004
  Lineal4218.6554.6622.820.060
    TempBarraCal168.1368.1293.520.079
    TiempoParada170.9470.9393.660.074
    PresBarraCal152.6252.6162.710.119
    TempMat126.9626.9631.390.255
  Cuadrado4372.0793.0184.800.010
    TempBarraCal*TempBarraCal1202.61202.61110.450.005
    TiempoParada*TiempoParada1175.32175.3189.050.008
    PresBarraCal*PresBarraCal150.5250.5222.610.126
    TempMat*TempMat137.8737.8661.950.181
  Interacción de 2 factores6546.7991.1324.700.006
    TempBarraCal*TiempoParada1540.47540.47027.890.000
    TempBarraCal*PresBarraCal10.120.1210.010.938
    TempBarraCal*TempMat10.300.3050.020.902
    TiempoParada*PresBarraCal14.844.8400.250.624
    TiempoParada*TempMat10.900.8990.050.832
    PresBarraCal*TempMat10.160.1600.010.929
Error16310.0819.380   
  Falta de ajuste10308.2030.82098.510.000
  Error puro61.880.313   
Total301447.60     

Paso 3: Determinar qué tan bien se ajusta el modelo a los datos

Para determinar qué tan bien se ajusta el modelo a los datos, examine los estadísticos de bondad de ajuste en la tabla Resumen del modelo.

S

Utilice S para evaluar qué tan bien el modelo describe la respuesta. Utilice S en lugar del estadístico R2 para comparar el ajuste de modelos.

S se mide en las unidades de la variable de respuesta y representa la variación de hasta qué punto se separa a los valores de datos de la superficie de respuesta verdadera. Mientras más bajo sea el valor de S, mejor describirá el modelo la respuesta. Sin embargo, un valor de S bajo no indica por sí solo que el modelo cumple con los supuestos del modelo. Debe examinar las gráficas de residuos para verificar los supuestos.

R-cuad.

Mientras mayor sea el valor de R2, mejor se ajustará el modelo a los datos. R2 siempre está entre 0% y 100%.

R2 siempre aumenta cuando se agregan más predictores a un modelo. Por ejemplo, el mejor modelo de cinco predictores siempre tendrá un R2 que será al menos tan alto como el mejor modelo de cuatro predictores. Por lo tanto, R2 es más útil cuando se comparan modelos del mismo tamaño.

R-cuad. (ajust)

Utilice R2 ajustado cuando desee comparar modelos que tengan diferentes números de predictores. R2 siempre aumenta cuando se agrega un predictor al modelo, incluso cuando no haya una mejora real en el modelo. El valor de R2 ajustado incorpora el número de predictores del modelo para ayudar a elegir el modelo correcto.

R-cuad.(pred)

Utilice R2 pronosticado para determinar qué tan bien el modelo predice la respuesta para nuevas observaciones. Los modelos que tienen valores más grandes de R2 pronosticado tienen mejor capacidad de predicción.

Un R2 pronosticado que sea sustancialmente menor que R2 puede indicar que el modelo está sobreajustado. Un modelo sobreajustado se produce cuando se agregan términos para efectos que no son importantes en la población. El modelo se adapta a los datos de la muestra y, por lo tanto, es posible que no sea útil para hacer predicciones acerca de la población.

R2 pronosticado también puede ser más útil que R2 ajustado para comparar modelos, porque se calcula con observaciones que no se incluyen en el cálculo del modelo.

AICc y BIC
Cuando usted muestra los detalles de cada paso de un método escalonado o cuando muestra los resultados expandidos del análisis, Minitab muestra dos estadísticos más. Estos estadísticos son el criterio de información de Akaike corregido (AICc) y el criterio de información bayesiano (BIC). Utilice estos estadísticos para comparar diferentes modelos. Para cada estadístico, se prefieren valores más pequeños.
Considere los siguientes puntos cuando interprete los estadísticos de bondad de ajuste:
  • Las muestras pequeñas no proporcionan una estimación precisa de la fuerza de la relación entre la respuesta y los predictores. Por ejemplo, si necesita que R2 sea más preciso, debe utilizar una muestra más grande (generalmente, 40 o más).
  • Los estadísticos de bondad de ajuste son simplemente una medida de qué tan bien se ajusta el modelo a los datos. Incluso cuando un modelo tenga un valor deseable, usted deberá revisar las gráficas de residuos para verificar que el modelo cumpla con los supuestos del modelo.

Resumen del modelo

SR-cuadradoR-cuadrado(ajustado)R-cuadrado
(pred)
4.4022878.58%59.84%0.00%
Resultados clave: S, R-cuad., R-cuad.(ajust), R-cuad.(pred)

En estos resultados, el modelo explica un 78,58% de la variación en la salida de luz. Sin embargo, el R2(pred) de 0% sugiere que el modelo está sobreajustado. Si se ajustan modelos adicionales con diferentes predictores, utilice los valores de R2 ajustado y los valores de R2 pronosticado para comparar qué tan bien se ajustan los modelos a los datos.

Paso 4: Determinar si el modelo cumple con los supuestos del análisis

Utilice las gráficas de residuos para ayudarle a determinar si el modelo es adecuado y cumple con los supuestos del análisis. Si los supuestos no se cumplen, el modelo no podría ajustarse a los datos adecuadamente y se debe tener precaución al momento de interpretar los resultados.

Para obtener más información sobre cómo manejar los patrones en las gráficas de residuos, vaya a Gráficas de residuos para Analizar diseño factorial y haga clic en el nombre de la gráfica de residuos en la lista que se encuentra en la parte superior de la página.

Gráfica de residuos vs. ajustes

Los patrones que se observan en la siguiente tabla podrían indicar que el modelo no cumple con los supuestos del modelo.
Patrón Lo que podría indicar el patrón
Dispersión en abanico o irregular de los residuos en los valores ajustados Varianza no constante
Curvilíneo Un término de orden superior faltante
Un punto que está alejado de cero Un valor atípico
Un punto que está lejos de los otros puntos en la dirección x Un punto influyente

Utilice la gráfica de ajustes versus residuos para comprobar el supuesto de que los residuos están distribuidos aleatoriamente y tienen una varianza constante. Idealmente, los puntos deben caer aleatoriamente en ambos lados de 0, con patrones no detectables en los puntos.

Gráfica de residuos vs. orden

Utilice la gráfica de orden versus residuos para comprobar el supuesto de que los residuos son independientes unos de otros. Los residuos independientes no muestran tendencias o patrones cuando se muestran en orden de tiempo. Los patrones en los puntos podrían indicar que los residuos que están cerca entre sí podrían estar correlacionados y por lo tanto, no son independientes. Idealmente, los residuos en la gráfica deben caer aleatoriamente alrededor de la línea central:
Si observa un patrón, investigue la causa. Los siguientes tipos de patrones pueden indicar que los residuos son dependientes.
Tendencia
Turno
Ciclo

Gráfica de probabilidad de normalidad de los residuos

Utilice la gráfica de probabilidad normal de los residuos para comprobar los supuestos de que los residuos están distribuidos normalmente. La gráfica de probabilidad normal de los residuos debe seguir aproximadamente una línea recta.

Los patrones que se observan en la siguiente tabla podrían indicar que el modelo no cumple con los supuestos del modelo.

Patrón Lo que podría indicar el patrón
No una línea recta No normalidad
Un punto que está alejado de la línea Un valor atípico
Cambio de pendiente Una variable no identificada