En términos de matriz, estas son las fórmulas para las diferentes sumas de cuadrados:
Minitab desglosa el componente SC Regresión o SC Tratamientos en la cantidad de variación explicada por cada término utilizando tanto la suma de cuadrados secuenciales como la suma de cuadrados ajustados.
Término | Description |
---|---|
b | vector de coeficientes |
X | matriz de diseño |
Y | vector de valores de respuesta |
n | número de observaciones |
J | n entre n matriz de 1s |
Minitab desglosa el componente SC Regresión o Tratamientos de la varianza en las sumas secuenciales de los cuadrados para cada factor. Las sumas secuenciales de los cuadrados dependen del orden en que los factores o predictores se ingresan en el modelo. Las sumas secuenciales de cuadrados es la porción única de la SC Regresión explicada por un factor, dados los factores ingresados previamente.
Por ejemplo, si se tiene un modelo con tres factores o predictores, X1, X2 y X3, la suma secuencial de cuadrados para X2 muestra qué proporción de la variación restante puede explicar X2, dado que X1 ya se encuentra en el modelo. Para obtener una secuencia diferente de factores, repita el análisis e ingrese los factores en un orden diferente.
Las sumas ajustadas de los cuadrados no dependen del orden en que los términos se ingresan en el modelo. La suma ajustada de los cuadrados es la cantidad de variación explicada por un término, dados todos los otros términos estén incluidos en el modelo, independientemente del orden en que se ingresen los términos en el modelo.
Por ejemplo, si usted tiene un modelo con tres factores, X1, X2 y X3, la suma ajustada de los cuadrados para X2 muestra la proporción de la variación restante que es explicada por el término para X2, dado que los términos para X1 y X3 también se encuentren en el modelo.
Los cálculos de las sumas ajustadas de los cuadrados para tres factores son:
donde SSR(X3 | X1, X2) es la suma ajustada de los cuadrados para X3, dado que X1 y X2 estén en el modelo.
donde SSR(X2, X3 | X1) es la suma ajustada de los cuadrados para X2 y X3, dado que X1 esté en el modelo.
Usted puede ampliar estas fórmulas si tienen más de 3 factores en el modelo1.
Los grados de libertad para cada componente del modelo son:
Fuentes de variación | GL |
---|---|
Factor | ki – 1 |
Covariables e interacciones entre covariables | 1 |
Interacciones que implican factores | |
Regresión | p |
Error | n – p – 1 |
Total | n – 1 |
Término | Description |
---|---|
ki | número de niveles en el iésimo factor |
m | número de factores |
n | número de observaciones |
p | número de coeficientes en el modelo, sin contar la constante |
La fórmula del cuadrado medio (CM) de la regresión es:
Término | Description |
---|---|
respuesta media | |
iésima respuesta ajustada | |
p | número de términos en el modelo |
El cuadrado medio del error (también abreviado como CM error o MSE y conocido como s2) es la varianza alrededor de la línea de regresión ajustada. La fórmula es:
Término | Description |
---|---|
yi | iésimo valor de respuesta observado |
iésima respuesta ajustada | |
n | número de observaciones |
p | número de coeficientes en el modelo, sin contar la constante |
Si todos los factores en el modelo son fijos, entonces el cálculo del estadístico F depende de lo que se trata la prueba de hipótesis, como sigue:
Si hay factores aleatorios en el modelo, F se construye utilizando la información del cuadrado medio esperado para cada término. Para obtener más información, consulte a Neter et al.1.
Término | Description |
---|---|
Término de CM Ajust. | Una medida de la cantidad de variación que explica un término después de representar los demás términos en el modelo. |
Error CM | Una medida de la variación que el modelo no explica. |
Falta de ajuste de CM | Una medida de la variación en la respuesta que pudiera modelarse agregando más términos al modelo. |
Error puro CM | Una medida de la variación en los datos de respuesta replicada. |
El valor p es una probabilidad que se calcula a partir de una distribución F con los grados de libertad (GL) que se indican a continuación:
1 − P(F ≤ fj)
Término | Description |
---|---|
P(F ≤ f) | función de distribución acumulada para la distribución F |
f | estadístico F para la prueba |
donde n = número de observaciones y m = número de distintas combinaciones del nivel x
Los valores F y los valores p pequeños sugieren que el modelo es inadecuado.
1 − P(F ≤ fj)
Término | Description |
---|---|
P(F ≤ fj) | función de distribución acumulada para la distribución F |
fj | estadístico F para la prueba |