合并标准差是一种用来估计单个标准差以表示研究中所有独立样本或组的方法,但前提是假定这些样本或组所在的总体具有相同的标准差。合并标准差是所有数据点围绕其组均值(而非总体均值)的平均散布。它是每个组的标准差的加权平均数。组越大,加权为组赋予的对总体估计值的效应会按比例加大。合并标准差用在双样本 t 检验、方差分析、控制图和能力分析中。
| 组 | 均值 | 标准差 | N |
|---|---|---|---|
| 1 | 9.7 | 2.5 | 50 |
| 2 | 12.1 | 2.9 | 50 |
| 3 | 14.5 | 3.2 | 50 |
| 4 | 17.3 | 6.8 | 200 |
前三个组大小相等 (n=50),标准差约为 3。第四个组要大得多 (n=200),标准差更大 (6.8)。由于合并标准差使用加权平均值,因此其值 (5.486) 更接近于最大组的标准差。如果使用了简单平均值,则所有组都将产生相同的影响。
假设 C1 包含响应,C3 包含每个因子水平的均值。例如:
| C1 | C2 | C3 |
|---|---|---|
| 响应 | 因子 | 均值 |
| 18.95 | 1 | 14.5033 |
| 12.62 | 1 | 14.5033 |
| 11.94 | 1 | 14.5033 |
| 14.42 | 2 | 10.5567 |
| 10.06 | 2 | 10.5567 |
| 7.19 | 2 | 10.5567 |
使用和以下表达式:
SQRT((SUM((C1 - C3)^2)) / (观测值总数 - 组个数))
对于前面的示例,合并标准差的表达式为:
SQRT((SUM(('响应' - '均值')^2)) / (6 - 2))
Minitab 存储的值为 3.75489。