Los grados de libertad total (GL) son la cantidad de información en los datos. El análisis utiliza esa información para estimar los valores de los parámetros de población infinita. El GL total está determinado por el número de observaciones en la muestra. El GL de un término muestra cuánta información utiliza el término. Si incrementa el tamaño de la muestra, obtendrá más información sobre la población, con lo cual aumentan los GL total. Si incrementa el número de términos en su modelo, utilizará más información, con lo cual disminuyen los GL disponibles para estimar la variabilidad de los estimados de parámetros.
Si se cumplen dos condiciones, entonces Minitab particiona los GL para error. La primera condición es que debe haber términos que se pueden ajustar con los datos que no están incluidos en el modelo actual. Por ejemplo, si se tiene un predictor continuo con 3 o más valores distintos, se puede estimar un término cuadrático para ese predictor. Si el modelo no incluye el término cuadrático, entonces no está incluido en el modelo un término que los datos pueden ajustar y se cumple esta condición.
La segunda condición es que los datos contienen replicas. Las replicas son observaciones donde cada predictor tiene el mismo valor. Por ejemplo, si se tienen 3 observaciones en las que la presión es de 5 y la temperatura es de 25, entonces esas 3 observaciones son replicas.
Si se cumplen las dos condiciones, entonces las dos partes de los GL para error son falta de ajuste y error puro. Los GL para la falta de ajuste permiten probar si la forma del modelo es adecuada. La prueba de falta de ajuste utiliza los grados de libertad para la falta de ajuste. Mientras más GL para error puro, mayor es la potencia de la prueba de falta de ajuste.
Las sumas ajustadas de los cuadrados son medidas de variación para las diferentes partes del modelo. El orden de los predictores en el modelo no afecta el cálculo de las sumas ajustadas de los cuadrados. En la tabla Análisis de varianza, Minitab separa las sumas de los cuadrados en diferentes componentes que describen la variación que se debe a fuentes diferentes.
Minitab utiliza las sumas ajustadas de los cuadrados para calcular los valores p en la tabla ANOVA. Minitab también utiliza las sumas de los cuadrados para calcular el estadístico R2. Por lo general, se interpretan los valores p y el estadístico R2 ajustado en lugar de las sumas de los cuadrados.
Los cuadrados medios ajustados miden qué tanta variación explica un término o un modelo, asumiendo que todos los demás términos están en el modelo, independientemente de su orden en el modelo. A diferencia de las sumas ajustadas de los cuadrados, los cuadrados medios ajustados consideran los grados de libertad.
El cuadrado medio ajustado del error (también llamado MSE o s2) es la varianza alrededor de los valores ajustados.
Minitab utiliza los cuadrados medios ajustados para calcular los valores p en la tabla ANOVA. Minitab también utiliza los cuadrados medios ajustados para calcular el estadístico de R2 ajustado. Generalmente, se interpretan los valores p y el estadístico de R2 ajustado en lugar de los cuadrados medios ajustados.
Las sumas secuenciales de los cuadrados son medidas de variación para diferentes partes del modelo. A diferencia de las sumas ajustadas de los cuadrados, las sumas secuenciales de los cuadrados dependen del orden en el que los términos están en el modelo.
Minitab no utiliza la suma secuencial de los cuadrados para calcular los valores p cuando usted analiza un diseño, pero puede usar la suma secuencial de los cuadrados cuando usted utiliza Ajustar modelo de regresión o Ajustar modelo lineal general. Por lo general, los valores p y el estadístico R2 se interpretan con base en las sumas ajustadas de los cuadrados.
La contribución muestra el porcentaje con el que cada fuente en la tabla Análisis de varianza contribuye a las sumas de cuadrados secuenciales totales (SC Sec.).
Porcentajes mayores indican que la fuente representa más de la variación en la respuesta.
Un valor F aparece para cada prueba en la tabla Análisis de varianza.
Minitab utiliza el valor F para calcular el valor p, que se usa para tomar una decisión acerca de la significancia estadística de la prueba. El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula. Un valor F lo suficientemente grande indica significancia estadística.
Si desea usar el valor F para determinar si puede rechazar la hipótesis nula, compare el valor F con su valor crítico. Puede calcular el valor crítico en Minitab o buscar el valor crítico en una tabla de la distribución F en la mayoría de los libros de estadística. Para obtener más información sobre cómo usar Minitab para calcular el valor crítico, vaya a Uso de la función de distribución acumulada inversa (ICDF) y haga clic en "Usar la ICDF para calcular los valores críticos".
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.
Para determinar si el modelo explica la variación en la respuesta, compare el valor p del modelo con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula del modelo es que el modelo no explica ninguna variación en la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que el modelo explica la variación en la respuesta cuando no es así.
Un valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.
En un experimento diseñado, las covariables representan variables que son medibles, pero difíciles de controlar. Por ejemplo, miembros de un equipo de control de calidad en una red de hospitales diseñan un experimento para estudiar la duración de la estadía de pacientes admitidos para cirugía de reemplazo total de rodilla. Para el experimento, el equipo puede controlar factores como el formato de las instrucciones antes de la operación. Para evitar sesgo, el equipo registra datos sobre las covariables que no pueden controlar, como la edad del paciente.
Para determinar si la asociación entre la respuesta y una covariable es estadísticamente significativa, compare el valor p de la covariable con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que el coeficiente de la covariable es cero, lo que implica que no hay asociación entre la covariable y la respuesta.
Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un 5% de riesgo de concluir que el coeficiente de un término de covariable lineal es cero cuando no es así.
Las covariables pueden aumentar la multicolinealidad en el modelo. Los factores de inflación de la varianza (FIV) son una medida de multicolinealidad. Cuando evalúe la significancia estadística de los términos de un modelo con covariables, considere los factores de inflación de la varianza (FIV). Para obtener más información, vaya a Tabla Coeficientes para Analizar diseño de cribado definitivo y haga clic en FIV.
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.
Los bloques representan las diferencias que puede ocurrir entre corridas que se realizan en diferentes condiciones. Por ejemplo, un ingeniero diseña un experimento para estudiar soldaduras y no puede recolectar todos los datos el mismo día. La calidad de la soldadura se ve afectada por varias variables que cambian día a día que el ingeniero no puede controlar, tales como la humedad relativa. Para tomar en consideración estas variables no controlables, el ingeniero agrupa las corridas realizadas cada día en bloques separados. Los bloques representan la variación de las variables no controlables, de manera que estos efectos no se confundan con los efectos de los factores que el ingeniero desea estudiar. Para obtener más información sobre cómo Minitab asigna las corridas a los bloques, vaya a ¿Qué es un bloque?.
Para determinar si diferentes condiciones entre corridas cambian la respuesta, compare el valor p de los bloques con su nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que diferentes condiciones no cambian la respuesta.
Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que condiciones diferentes en la ejecución de las corridas producen un cambio en la respuesta cuando en realidad no es así.
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.
Si un grupo de términos es estadísticamente significativo, entonces usted puede concluir que por lo menos uno de los términos del grupo tiene un efecto en la respuesta. Cuando se utiliza la significancia estadística para decidir cuáles términos mantener en un modelo, por lo general no se eliminan grupos completos de términos a la vez. La significancia estadística de los términos individuales puede cambiar debido a los términos incluidos en el modelo.
Fuente | GL | SC Ajust. | MC Ajust. | Valor F | Valor p |
---|---|---|---|---|---|
Modelo | 10 | 447.766 | 44.777 | 17.61 | 0.003 |
Lineal | 4 | 428.937 | 107.234 | 42.18 | 0.000 |
Material | 1 | 181.151 | 181.151 | 71.25 | 0.000 |
PresIny | 1 | 112.648 | 112.648 | 44.31 | 0.001 |
TempIny | 1 | 73.725 | 73.725 | 29.00 | 0.003 |
TempEnfr | 1 | 61.412 | 61.412 | 24.15 | 0.004 |
Interacciones de 2 términos | 6 | 18.828 | 3.138 | 1.23 | 0.418 |
Material*PresIny | 1 | 0.342 | 0.342 | 0.13 | 0.729 |
Material*TempIny | 1 | 0.778 | 0.778 | 0.31 | 0.604 |
Material*TempEnfr | 1 | 4.565 | 4.565 | 1.80 | 0.238 |
PresIny*TempIny | 1 | 0.002 | 0.002 | 0.00 | 0.978 |
PresIny*TempEnfr | 1 | 0.039 | 0.039 | 0.02 | 0.906 |
TempIny*TempEnfr | 1 | 13.101 | 13.101 | 5.15 | 0.072 |
Error | 5 | 12.712 | 2.542 | ||
Total | 15 | 460.478 |
En este modelo, la prueba para el grupo de interacciones de dos factores no es estadísticamente significativa en el nivel de 0.05. Además, las pruebas para todas las interacciones individuales de 2 factores no son estadísticamente significativas.
Fuente | GL | SC Ajust. | MC Ajust. | Valor F | Valor p |
---|---|---|---|---|---|
Modelo | 5 | 442.04 | 88.408 | 47.95 | 0.000 |
Lineal | 4 | 428.94 | 107.234 | 58.16 | 0.000 |
Material | 1 | 181.15 | 181.151 | 98.24 | 0.000 |
PresIny | 1 | 112.65 | 112.648 | 61.09 | 0.000 |
TempIny | 1 | 73.73 | 73.725 | 39.98 | 0.000 |
TempEnfr | 1 | 61.41 | 61.412 | 33.31 | 0.000 |
Interacciones de 2 términos | 1 | 13.10 | 13.101 | 7.11 | 0.024 |
TempIny*TempEnfr | 1 | 13.10 | 13.101 | 7.11 | 0.024 |
Error | 10 | 18.44 | 1.844 | ||
Total | 15 | 460.48 |
Si usted reduce el modelo un término a la vez, comenzando con la interacción de 2 factores con el valor p más alto, entonces la última interacción de 2 factores es estadísticamente significativa en el nivel de 0.05.
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.
Si el valor p es mayor que el nivel de significancia, la prueba no detecta ninguna falta de ajuste.