La desviación estándar agrupada es un método para estimar una sola desviación estándar que represente a todas las muestras o los grupos independientes incluidos en el estudio cuando se parte del supuesto de que provienen de poblaciones con una desviación estándar común. La desviación estándar agrupada es la dispersión promedio de todos los puntos de los datos alrededor de su media grupal (no de la media general). Es un promedio ponderado de la desviación estándar de cada grupo. La ponderación da a los grupos más grandes un efecto proporcionalmente mayor sobre la estimación general. Las desviaciones estándar agrupadas se utilizan en las pruebas t de 2 muestras, los ANOVA, las gráficas de control y el análisis de capacidad.
Grupo | Media | Desviación estándar | N |
---|---|---|---|
1 | 9.7 | 2.5 | 50 |
2 | 12.1 | 2.9 | 50 |
3 | 14.5 | 3.2 | 50 |
4 | 17.3 | 6.8 | 200 |
Los primeros tres grupos tienen el mismo tamaño (n=50) con desviaciones estándar de aproximadamente 3. El cuarto grupo es mucho más grande (n=200) y tiene una desviación estándar mayor (6.8). Puesto que la desviación estándar agrupada utiliza un promedio ponderado, su valor (5.486) está más cerca de la desviación estándar del grupo más grande. Si usted utilizara un promedio simple, entonces todos los grupos tendrían el mismo efecto.
Supongamos que C1 contiene la respuesta y C3 contiene la media de cada nivel de los factores. Por ejemplo:
C1 | C2 | C3 |
---|---|---|
Respuesta | Factor | Media |
18.95 | 1 | 14.5033 |
12.62 | 1 | 14.5033 |
11.94 | 1 | 14.5033 |
14.42 | 2 | 10.5567 |
10.06 | 2 | 10.5567 |
7.19 | 2 | 10.5567 |
Utilice
con la siguiente expresión:SQRT((SUM((C1 - C3)^2)) / (número de total de observaciones - número de grupos))
Para el ejemplo anterior, la expresión para la desviación estándar agrupada sería:
SQRT((SUM(('Respuesta' - 'Media')^2)) / (6 - 2))
El valor que almacena Minitab es 3.75489.