Explicación de las sumas de los cuadrados

En este tema

¿Qué es la suma de los cuadrados?
Suma de los cuadrados en ANOVA
Suma de los cuadrados en regresión
Comparación de las sumas secuenciales de los cuadrados y las sumas ajustadas de los cuadrados
¿Qué es la suma de los cuadrados no corregida?

¿Qué es la suma de los cuadrados?

La suma de cuadrados representa una medida de variación o desviación con respecto a la media. Se calcula como una suma de los cuadrados de las diferencias con respecto a la media. El cálculo de la suma total de los cuadrados considera tanto la suma de los cuadrados de los factores como la de aleatoriedad o error.

Suma de los cuadrados en ANOVA

En el análisis de varianza (ANOVA), la suma total de los cuadrados ayuda a expresar la variación total que se puede atribuir a diferentes factores. Por ejemplo, usted hace un experimento para probar la efectividad de tres detergentes para ropa.

La suma total de los cuadrados = suma de los cuadrados del tratamiento (SST) + suma de los cuadrados del error residual (SSE)

La suma de los cuadrados del tratamiento es la variación atribuida a, o en este caso entre, los detergentes para ropa. La suma de los cuadrados del error residual es la variación atribuida al error.

El convertir la suma de los cuadrados en cuadrados medios al dividir entre los grados de libertad le permitirá comparar estas relaciones y determinar si existe una diferencia significativa debido al detergente. Mientras mayor sea esta relación, más afectarán los tratamientos el resultado.

Suma de los cuadrados en regresión

En la regresión, la suma total de los cuadrados ayuda a expresar la variación total de las Y. Por ejemplo, usted recoge datos para determinar un modelo que explique las ventas generales en función de su presupuesto de publicidad.

La suma total de los cuadrados = suma de los cuadrados de la regresión (SSR) + suma de los cuadrados del error residual (SSE)

La suma de los cuadrados de la regresión es la variación atribuida a la relación entre las X y las Y o, en este caso, entre el presupuesto de publicidad y las ventas. La suma de los cuadrados del error residual es la variación atribuida al error.

Al comparar la suma de los cuadrados de la regresión con la suma total de los cuadrados, se determina la proporción de la variación total que es explicada por el modelo de regresión (R², el coeficiente de determinación). Mientras más grande sea este valor, mejor será la relación que explique las ventas en función del presupuesto de publicidad.

Comparación de las sumas secuenciales de los cuadrados y las sumas ajustadas de los cuadrados

Minitab desglosa el componente SC Regresión o Tratamientos de la varianza en las sumas de los cuadrados para cada factor.

Sumas secuenciales de los cuadrados

Las sumas secuenciales de los cuadrados dependen del orden en que los factores se ingresan en el modelo. Es la porción única de la SC Regresión explicada por un factor, dados los factores ingresados previamente.

Por ejemplo, si usted tiene un modelo con tres factores, X1, X2 y X3, la suma secuencial de los cuadrados para X2 muestra la proporción de la variación restante que es explicada por X2, dado que X1 ya se encuentre en el modelo. Para obtener una secuencia diferente de factores, repita el procedimiento de regresión ingresando los factores en un orden diferente.

Sumas ajustadas de los de cuadrados

Las sumas ajustadas de los cuadrados no dependen del orden en que los factores se ingresan en el modelo. Es la porción única de la SC Regresión explicada por un factor, dados todos los demás factores en el modelo, independientemente del orden en que se ingresaron en el mismo.

Por ejemplo, si usted tiene un modelo con tres factores, X1, X2 y X3, la suma ajustada de los cuadrados para X2 muestra la proporción de la variación restante que es explicada por X2, dado que X1 y X3 también se encuentren en el modelo.

¿Cuándo serán iguales las sumas secuenciales y ajustadas de los cuadrados?

Las sumas secuenciales y ajustadas de los cuadrados siempre son iguales para el último término del modelo. Por ejemplo, si el modelo contiene los términos A, B y C (en ese orden), entonces los dos sumas de los cuadrados para C representan la reducción en la suma de los cuadrados del error residual que se produce cuando C se agrega a un modelo que contiene A y B.

Las sumas secuenciales y ajustadas de los cuadrados será igual para todos los términos si la matriz de diseño es ortogonal. El caso más común en el que ocurre esto es con los diseños factoriales y factoriales fraccionados (sin covariables) cuando se analizan en unidades codificadas. En estos diseños, las columnas de la matriz de diseño para todos los efectos principales y las interacciones son ortogonales entre sí. Los diseños de Plackett-Burman tienen columnas ortogonales para los efectos principales (por lo general los únicos términos en el modelo), pero los términos de interacción, si existen, pueden confundirse parcialmente con otros términos (es decir, no ortogonales). En los diseños de superficie de respuesta, las columnas para los términos al cuadrado no son ortogonales entre sí.

Para cualquier diseño, si la matriz de diseño se encuentra en unidades no codificadas, entonces puede haber columnas que no son ortogonales, a menos que los niveles de los factores aún estén centrados en cero.

¿Pueden las sumas ajustadas de los cuadrados ser menores, iguales o mayores que las sumas secuenciales de los cuadrados?

Las sumas ajustadas de los cuadrados pueden ser menores, iguales o mayores que las sumas secuenciales de los cuadrados.

Supongamos que usted ajusta un modelo con los términos A, B, C y A*B. Sea SC (A, B, C, A*B) la suma de los cuadrados cuando A, B, C y A*B estén en el modelo. Sea SC (A, B, C) la suma de los cuadrados cuando A, B y C estén incluidos en el modelo. Entonces, la suma ajustada de los cuadrados para A*B es:

SC(A, B, C, A*B) - SC(A, B, C)

Sin embargo, con los mismos términos A, B, C, A*B en el modelo, la suma secuencial de los cuadrados para A*B depende del orden en que los términos se especificaron en el modelo.

Utilizando una notación similar, si el orden es A, B, A*B, C, entonces la suma secuencial de los cuadrados para A*B es:

SC(A, B, A*B) - SC(A, B)

Dependiendo del conjunto de datos y del orden en el que se especifiquen los términos, todos los casos siguientes son posibles:

SC(A, B, C, A*B) - SC(A, B, C) < SC(A, B, A*B) - SC(A, B), o
SC(A, B, C, A*B) - SC(A, B, C) = SC(A, B, A*B) - SC(A, B), o
SC(A, B, C, A*B) - SC(A, B, C) > SC(A, B, A*B) - SC(A, B)

¿Qué es la suma de los cuadrados no corregida?

Eleva al cuadrado cada uno de los valores de la columna y calcula la suma de esos valores elevados al cuadrado. Es decir, si la columna contiene x1, x2, ... , xn, entonces la suma de los cuadrados calcula (x₁² + x₂²+ ... + x_n²). A diferencia de la suma de los cuadrados corregida, la suma de los cuadrados no corregida incluye el error. Los valores de datos se elevan al cuadrado sin antes restar la media.

En Minitab, puede utilizar estadísticos descriptivos para mostrar la suma de los cuadrados no corregida. También puede utilizar la función de suma de los cuadrados (SSQ) en la Calculadora para calcular la suma de los cuadrados no corregida de una columna o fila. Por ejemplo, está calculando una fórmula manualmente y desea obtener la suma de los cuadrados para un conjunto de variables de respuesta (Y).

En la calculadora, ingrese la expresión: SSQ (C1).

Almacene los resultados en C2 para ver la suma de los cuadrados no corregida. La siguiente hoja de trabajo muestra los resultados del uso de la calculadora para calcular la suma de los cuadrados de la columna Y.

C1	C2
Y	Suma de los cuadrados
2.40	41.5304
4.60
2.50
1.60
2.20
0.98

Nota

Minitab omite los valores faltantes del cálculo de esta función.