¿Qué es la desviación estándar agrupada?

La desviación estándar agrupada es un método para estimar una sola desviación estándar que represente a todas las muestras o los grupos independientes incluidos en el estudio cuando se parte del supuesto de que provienen de poblaciones con una desviación estándar común. La desviación estándar agrupada es la dispersión promedio de todos los puntos de los datos alrededor de su media grupal (no de la media general). Es un promedio ponderado de la desviación estándar de cada grupo. La ponderación da a los grupos más grandes un efecto proporcionalmente mayor sobre la estimación general. Las desviaciones estándar agrupadas se utilizan en las pruebas t de 2 muestras, los ANOVA, las gráficas de control y el análisis de capacidad.

Ejemplo de una desviación estándar agrupada

Supongamos que un estudio tiene los cuatro grupos siguientes:

Grupo	Media	Desviación estándar	N
1	9.7	2.5	50
2	12.1	2.9	50
3	14.5	3.2	50
4	17.3	6.8	200

Los primeros tres grupos tienen el mismo tamaño (n=50) con desviaciones estándar de aproximadamente 3. El cuarto grupo es mucho más grande (n=200) y tiene una desviación estándar mayor (6.8). Puesto que la desviación estándar agrupada utiliza un promedio ponderado, su valor (5.486) está más cerca de la desviación estándar del grupo más grande. Si usted utilizara un promedio simple, entonces todos los grupos tendrían el mismo efecto.

Cálculo manual de la desviación estándar agrupada

Supongamos que C1 contiene la respuesta y C3 contiene la media de cada nivel de los factores. Por ejemplo:

C1	C2	C3
Respuesta	Factor	Media
18.95	1	14.5033
12.62	1	14.5033
11.94	1	14.5033
14.42	2	10.5567
10.06	2	10.5567
7.19	2	10.5567

Utilice Calc > Calculadora con la siguiente expresión:

SQRT((SUM((C1 - C3)^2)) / (número de total de observaciones - número de grupos))

Para el ejemplo anterior, la expresión para la desviación estándar agrupada sería:

SQRT((SUM(('Respuesta' - 'Media')^2)) / (6 - 2))

El valor que almacena Minitab es 3.75489.