样本数量 (N) 是每个组中的观测值总数。
样本数量影响置信区间和检验功效。
通常,数量较大的样本将产生较窄的置信区间。样本数量越大,检验检测到差分的功效越大。
每个组中的观测值均值。均值使用确定数据中心的单个值来描述每个组。只需用组的所有观测值的和除以组中的观测值个数即可得出该值。
每个样本的均值提供了每个总体均值的估计值。样本均值之间的差分是总体均值之间差分的估计值。
由于组均值之间的差分均基于样本数据而不是整个总体,因此您不能确定它是否等于总体差分。为更好地了解总体差分,可以使用置信区间。
标准差是离差的最常用度量,即数据围绕均值扩散的程度。符号 σ(西格玛)常用来表示总体的标准差。符号 s 用来表示样本的标准差。
一个组的样本标准差是该组总体标准差的估计值。标准差用于计算置信区间和 p 值。样本标准差越大,置信区间的精确度越低(越宽),统计的功效也越低。
方差分析假定所有水平的总体标准差相等。如果无法假定等方差,请使用 Welch 方差分析,它属于单因子方差分析的选项。
这些置信区间 (CI) 是可能包含每个总体的实际差分的值范围。置信区间采用合并标准差计算。
由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。
使用置信区间可以评估每个组的总体均值的估计值。
例如,当置信水平为 95% 时,置信区间包含组均值的置信度为 95%。置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。
油漆 | N | 均值 | 标准差 | 95% 置信区间 |
---|---|---|---|---|
配方 1 | 6 | 14.73 | 3.36 | (11.37, 18.10) |
配方 2 | 6 | 8.57 | 5.50 | (5.20, 11.93) |
配方 3 | 6 | 12.98 | 3.73 | (9.62, 16.35) |
配方 4 | 6 | 18.07 | 2.64 | (14.70, 21.43) |
在这些结果中,每种混料都具有其平均硬度的置信区间。针对这些数据的多重比较结果显示,混料 4 与混料 2 相比,硬度明显更高。混料 4 比混料 2 更硬并不表示混料 4 的硬度足以用作油漆。组均值的置信区间才是判断混料 4 的硬度是否足够的更有效标准。
合并标准差是对所有水平公共标准差的估计值。合并标准差是所有数据点在其组均值(不是总体均值)附近的标准差。组越大,对合并标准差的总体估计值的影响也会按比例增加。
标准差值越大,数据越分散。值越大,置信区间就越不精确(越宽),统计的功效也越低。
Minitab 使用合并标准差,针对组均值和组均值之间的差分创建置信区间。
组 | 均值 | 标准差 | N |
---|---|---|---|
1 | 9.7 | 2.5 | 50 |
2 | 12.1 | 2.9 | 50 |
3 | 14.5 | 3.2 | 50 |
4 | 17.3 | 6.8 | 200 |
前三个组大小相等 (n=50),标准差约为 3。第四个组要大得多 (n=200) 且标准差更大 (6.8)。由于合并标准差使用加权平均值,因此其值 (5.488) 更接近于最大组的标准差。