Tabla Análisis de varianza para Analizar diseño de cribado definitivo

GL

Los grados de libertad total (GL) son la cantidad de información en los datos. El análisis utiliza esa información para estimar los valores de los parámetros de población infinita. El GL total está determinado por el número de observaciones en la muestra. El GL de un término muestra cuánta información utiliza el término. Si incrementa el tamaño de la muestra, obtendrá más información sobre la población, con lo cual aumentan los GL total. Si incrementa el número de términos en su modelo, utilizará más información, con lo cual disminuyen los GL disponibles para estimar la variabilidad de los estimados de parámetros.

Si se cumplen dos condiciones, entonces Minitab particiona los GL para error. La primera condición es que debe haber términos que se pueden ajustar con los datos que no están incluidos en el modelo actual. Por ejemplo, si se tiene un predictor continuo con 3 o más valores distintos, se puede estimar un término cuadrático para ese predictor. Si el modelo no incluye el término cuadrático, entonces no está incluido en el modelo un término que los datos pueden ajustar y se cumple esta condición.

La segunda condición es que los datos contienen replicas. Las replicas son observaciones donde cada predictor tiene el mismo valor. Por ejemplo, si se tienen 3 observaciones en las que la presión es de 5 y la temperatura es de 25, entonces esas 3 observaciones son replicas.

Si se cumplen las dos condiciones, entonces las dos partes de los GL para error son falta de ajuste y error puro. Los GL para la falta de ajuste permiten probar si la forma del modelo es adecuada. La prueba de falta de ajuste utiliza los grados de libertad para la falta de ajuste. Mientras más GL para error puro, mayor es la potencia de la prueba de falta de ajuste.

SC ajust.

Las sumas ajustadas de los cuadrados son medidas de variación para las diferentes partes del modelo. El orden de los predictores en el modelo no afecta el cálculo de las sumas ajustadas de los cuadrados. En la tabla Análisis de varianza, Minitab separa las sumas de los cuadrados en diferentes componentes que describen la variación que se debe a fuentes diferentes.

SC ajust. para el modelo
La suma ajustada de los cuadrados para el modelo es la diferencia entre la suma total de los cuadrados y la suma de los cuadrados del error. Es la suma de todas las sumas secuenciales de los cuadrados para los términos incluidos en el modelo.
SC ajust. para grupos de términos
La suma ajustada de los cuadrados para un grupo de términos cuantifica la cantidad de variación en los datos de respuesta que es explicada por el grupo de términos.
SC ajust. para un término
La suma ajustada de los cuadrados de un término es el aumento en la suma de los cuadrados del modelo en comparación de un modelo que solo tenga los otros términos. Cuantifica la cantidad de variación en los datos de respuesta que es explicada por el término.
SC ajust. para el error
La suma ajustada de los cuadrados para el error es la suma de los residuos cuadráticos. Cuantifica la variación en los datos que no es explicada por el modelo.
SC ajust. para el error puro
La suma ajustada de los cuadrados del error puro es parte de la suma de los cuadrados del error. La suma de los cuadrados del error puro existe cuando existen los grados de libertad para el error puro. Para obtener más información, vaya a la sección sobre Grados de libertad (GL). Cuantifica la variación en los datos para observaciones con los mismos valores de los factores, bloques y covariables.
SC ajust. total
La suma total ajustada de los cuadrados es la suma de la suma de los cuadrados del modelo y la suma de los cuadrados del error. Cuantifica la variación total en los datos.

Interpretación

Minitab utiliza las sumas ajustadas de los cuadrados para calcular los valores p en la tabla ANOVA. Minitab también utiliza las sumas de los cuadrados para calcular el estadístico R2. Por lo general, se interpretan los valores p y el estadístico R2 ajustado en lugar de las sumas de los cuadrados.

CM Ajust.

Los cuadrados medios ajustados miden qué tanta variación explica un término o un modelo, asumiendo que todos los demás términos están en el modelo, independientemente de su orden en el modelo. A diferencia de las sumas ajustadas de los cuadrados, los cuadrados medios ajustados consideran los grados de libertad.

El cuadrado medio ajustado del error (también llamado MSE o s2) es la varianza alrededor de los valores ajustados.

Interpretación

Minitab utiliza los cuadrados medios ajustados para calcular los valores p en la tabla ANOVA. Minitab también utiliza los cuadrados medios ajustados para calcular el estadístico de R2 ajustado. Generalmente, se interpretan los valores p y el estadístico de R2 ajustado en lugar de los cuadrados medios ajustados.

SC sec.

Las sumas secuenciales de los cuadrados son medidas de variación para diferentes partes del modelo. A diferencia de las sumas ajustadas de los cuadrados, las sumas secuenciales de los cuadrados dependen del orden en el que los términos están en el modelo.

SC sec. para el modelo
La suma secuencial de los cuadrados para el modelo es la diferencia entre la suma total de los cuadrados y la suma de los cuadrados del error. Es la suma de todas las sumas secuenciales de los cuadrados para los términos incluidos en el modelo.
SC sec. para grupos de términos
La suma secuencial de los cuadrados para un grupo de términos incluidos en el modelo es la suma de las sumas secuenciales de los cuadrados para todos los términos incluidos en el grupo. Cuantifica la cantidad de variación en los datos de respuesta que es explicada por el grupo de términos.
SC sec. para un término
La suma secuencial de los cuadrados para un término es el aumento en la suma de los cuadrados del modelo en comparación con un modelo que solo contenga los términos que aparecen por encima de este en la tabla ANOVA. Cuantifica el aumento en la suma de los cuadrados del modelo cuando ese término se agrega a un modelo con los términos que aparecen por encima de este.
SC sec. para el error
La suma secuencial de los cuadrados del error es la suma de los residuos cuadráticos. Cuantifica la variación en los datos que los predictores no explican.
SC sec. para el error puro
La suma secuencial de los cuadrados del error puro es parte de la suma de los cuadrados del error. La suma de los cuadrados del error puro existe cuando existen los grados de libertad para el error puro. Para obtener más información, vaya a la sección sobre Grados de libertad (GL). Cuantifica la variación en los datos para observaciones con los mismos valores de los factores, bloques y covariables.
SC sec. total
La suma secuencial total de los cuadrados es la suma de la suma de los cuadrados del modelo y la suma de los cuadrados del error. Cuantifica la variación total en los datos.

Interpretación

Minitab no utiliza la suma secuencial de los cuadrados para calcular los valores p cuando usted analiza un diseño, pero puede usar la suma secuencial de los cuadrados cuando usted utiliza Ajustar modelo de regresión o Ajustar modelo lineal general. Por lo general, los valores p y el estadístico R2 se interpretan con base en las sumas ajustadas de los cuadrados.

Contribución

La contribución muestra el porcentaje con el que cada fuente en la tabla Análisis de varianza contribuye a las sumas de cuadrados secuenciales totales (SC Sec.).

Interpretación

Porcentajes mayores indican que la fuente representa más de la variación en la respuesta.

Valor F

Un valor F aparece para cada prueba en la tabla Análisis de varianza.

Valor F para el modelo
El valor F es el estadístico de prueba utilizado para determinar si cualquier término presente en el modelo está asociado con la respuesta, incluyendo covariables, bloques y términos de factores.
Valor F para covariables como un grupo
El valor F es el estadístico de prueba utilizado para determinar si cualquiera de las covariables está asociada con la respuesta simultáneamente.
Valor F para covariables individuales
El valor F es el estadístico de prueba utilizado para determinar si una covariable individual está asociada con la respuesta.
Valor F para bloques
El valor F es el estadístico de prueba utilizado para determinar si condiciones diferentes entre los bloques están asociadas con la respuesta.
Valor F para tipos de términos de factores
El valor F es el estadístico de prueba utilizado para determinar si un grupo de términos está asociado con la respuesta. Algunos ejemplos de grupos de términos son los efectos lineales y las interacciones de 2 factores.
Valor F para términos individuales
El valor F es el estadístico de prueba usado para determinar si el término está asociado con la respuesta.
Valor F para la prueba de falta de ajuste
El valor F es el estadístico de prueba utilizado para determinar si faltan términos en el modelo que incluyen los factores especificados en el experimento. Si se eliminan bloques o covariables del modelo mediante un procedimiento escalonado, entonces la prueba de falta de ajuste también incluye estos términos.

Interpretación

Minitab utiliza el valor F para calcular el valor p, que se usa para tomar una decisión acerca de la significancia estadística de la prueba. El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula. Un valor F lo suficientemente grande indica significancia estadística.

Si desea usar el valor F para determinar si puede rechazar la hipótesis nula, compare el valor F con su valor crítico. Puede calcular el valor crítico en Minitab o buscar el valor crítico en una tabla de la distribución F en la mayoría de los libros de estadística. Para obtener más información sobre cómo usar Minitab para calcular el valor crítico, vaya a Uso de la función de distribución acumulada inversa (ICDF) y haga clic en "Usar la ICDF para calcular los valores críticos".

Valor p – Modelo

El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

Interpretación

Para determinar si el modelo explica la variación en la respuesta, compare el valor p del modelo con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula del modelo es que el modelo no explica ninguna variación en la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que el modelo explica la variación en la respuesta cuando no es así.

Valor p ≤ α: El modelo explica la variación en la respuesta
Si el valor p es menor que o igual al nivel de significancia, usted concluye que el modelo explica la variación en la respuesta.
Valor p > α: No hay suficiente evidencia para concluir que el modelo explica la variación en la respuesta
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que el modelo explica la variación en la respuesta. Convendría que ajuste un nuevo modelo.

Valor p – Covariables

Un valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

En un experimento diseñado, las covariables representan variables que son medibles, pero difíciles de controlar. Por ejemplo, miembros de un equipo de control de calidad en una red de hospitales diseñan un experimento para estudiar la duración de la estadía de pacientes admitidos para cirugía de reemplazo total de rodilla. Para el experimento, el equipo puede controlar factores como el formato de las instrucciones antes de la operación. Para evitar sesgo, el equipo registra datos sobre las covariables que no pueden controlar, como la edad del paciente.

Interpretación

Para determinar si la asociación entre la respuesta y una covariable es estadísticamente significativa, compare el valor p de la covariable con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que el coeficiente de la covariable es cero, lo que implica que no hay asociación entre la covariable y la respuesta.

Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un 5% de riesgo de concluir que el coeficiente de un término de covariable lineal es cero cuando no es así.

Las covariables pueden aumentar la multicolinealidad en el modelo. Los factores de inflación de la varianza (FIV) son una medida de multicolinealidad. Cuando evalúe la significancia estadística de los términos de un modelo con covariables, considere los factores de inflación de la varianza (FIV). Para obtener más información, vaya a Tabla Coeficientes para Analizar diseño de cribado definitivo y haga clic en FIV.

Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que la asociación entre la respuesta y la covariable es estadísticamente significativa.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que la asociación entre la respuesta y la covariable es estadísticamente significativa. Convendría que ajuste un modelo sin la covariable.

Valor p – Bloques

El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

Los bloques representan las diferencias que puede ocurrir entre corridas que se realizan en diferentes condiciones. Por ejemplo, un ingeniero diseña un experimento para estudiar soldaduras y no puede recolectar todos los datos el mismo día. La calidad de la soldadura se ve afectada por varias variables que cambian día a día que el ingeniero no puede controlar, tales como la humedad relativa. Para tomar en consideración estas variables no controlables, el ingeniero agrupa las corridas realizadas cada día en bloques separados. Los bloques representan la variación de las variables no controlables, de manera que estos efectos no se confundan con los efectos de los factores que el ingeniero desea estudiar. Para obtener más información sobre cómo Minitab asigna las corridas a los bloques, vaya a ¿Qué es un bloque?.

Interpretación

Para determinar si diferentes condiciones entre corridas cambian la respuesta, compare el valor p de los bloques con su nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que diferentes condiciones no cambian la respuesta.

Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que condiciones diferentes en la ejecución de las corridas producen un cambio en la respuesta cuando en realidad no es así.

Valor p ≤ α: Diferentes condiciones cambian la respuesta
Si el valor p es menor que o igual al nivel de significancia, usted concluye que diferentes condiciones cambian la respuesta.
Valor p > α: No hay suficiente evidencia para concluir que diferentes condiciones cambian la respuesta
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que diferentes condiciones cambian la respuesta. Le convendría ajustar un modelo sin bloques.

Valor p – Términos lineales, términos cuadráticos, interacciones y grupos de términos

El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

Interpretación

Si un término del modelo es estadísticamente significativo, la interpretación depende del tipo de término. Las interpretaciones son las siguientes:
  • Si una covariable es significativa, usted puede concluir que el coeficiente de la covariable no es igual a cero.
  • Si un factor categórico es significativo, usted puede concluir que las medias de nivel no son iguales.
  • Si un término de interacción es significativo, usted puede concluir que la relación entre un factor y la respuesta depende de los otros factores incluidos en el término.
  • Si un término cuadrático es significativo, usted puede concluir que la superficie de respuesta contiene curvatura.

Pruebas de grupos de términos

Si un grupo de términos es estadísticamente significativo, entonces usted puede concluir que por lo menos uno de los términos del grupo tiene un efecto en la respuesta. Cuando se utiliza la significancia estadística para decidir cuáles términos mantener en un modelo, por lo general no se eliminan grupos completos de términos a la vez. La significancia estadística de los términos individuales puede cambiar debido a los términos incluidos en el modelo.

Análisis de Varianza

FuenteGLSC Ajust.MC Ajust.Valor FValor p
Modelo10447.76644.77717.610.003
  Lineal4428.937107.23442.180.000
    Material1181.151181.15171.250.000
    PresIny1112.648112.64844.310.001
    TempIny173.72573.72529.000.003
    TempEnfr161.41261.41224.150.004
  Interacciones de 2 términos618.8283.1381.230.418
    Material*PresIny10.3420.3420.130.729
    Material*TempIny10.7780.7780.310.604
    Material*TempEnfr14.5654.5651.800.238
    PresIny*TempIny10.0020.0020.000.978
    PresIny*TempEnfr10.0390.0390.020.906
    TempIny*TempEnfr113.10113.1015.150.072
Error512.7122.542   
Total15460.478     

En este modelo, la prueba para el grupo de interacciones de dos factores no es estadísticamente significativa en el nivel de 0.05. Además, las pruebas para todas las interacciones individuales de 2 factores no son estadísticamente significativas.

Análisis de Varianza

FuenteGLSC Ajust.MC Ajust.Valor FValor p
Modelo5442.0488.40847.950.000
  Lineal4428.94107.23458.160.000
    Material1181.15181.15198.240.000
    PresIny1112.65112.64861.090.000
    TempIny173.7373.72539.980.000
    TempEnfr161.4161.41233.310.000
  Interacciones de 2 términos113.1013.1017.110.024
    TempIny*TempEnfr113.1013.1017.110.024
Error1018.441.844   
Total15460.48     

Si usted reduce el modelo un término a la vez, comenzando con la interacción de 2 factores con el valor p más alto, entonces la última interacción de 2 factores es estadísticamente significativa en el nivel de 0.05.

Valor p – Falta de ajuste

El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

Interpretación

Para determinar si el modelo especifica correctamente la relación entre la respuesta y los predictores, compare el valor p de la prueba de falta de ajuste con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula para la prueba de falta de ajuste es que el modelo especifica correctamente la relación entre la respuesta y los predictores. Por lo general, un nivel de significancia (denotado como alfa o α) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que el modelo no especifica correctamente la relación entre la respuesta y los predictores cuando el modelo sí especifica la relación correcta.
Valor p ≤ α: La falta de ajuste es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted concluye que el modelo no especifica correctamente la relación. Para mejorar el modelo, es posible que tenga que agregar términos o transformar los datos.
Valor p > α: La falta de ajuste no es estadísticamente significativa

Si el valor p es mayor que el nivel de significancia, la prueba no detecta ninguna falta de ajuste.