单因子方差分析的均值表

请查找均值表中每个统计量的定义和解释。

N

样本数量 (N) 是每个组中的观测值总数。

解释

样本数量影响置信区间和检验功效。

通常,数量较大的样本将产生较窄的置信区间。样本数量越大,检验检测到差分的功效越大。

均值

每个组中的观测值均值。均值使用确定数据中心的单个值来描述每个组。只需用组的所有观测值的和除以组中的观测值个数即可得出该值。

解释

每个样本的均值提供了每个总体均值的估计值。样本均值之间的差分是总体均值之间差分的估计值。

由于组均值之间的差分均基于样本数据而不是整个总体,因此您不能确定它是否等于总体差分。为更好地了解总体差分,可以使用置信区间。

标准差 (StDev)

标准差是离差的最常用度量,即数据围绕均值扩散的程度。符号 σ(西格玛)常用来表示总体的标准差。符号 s 用来表示样本的标准差。

解释

标准差与变量采用相同的单位。标准差值越大,数据越分散。一个较好的正态分布如下所示:
  • 约 68% 的值落在一个均值标准差之内。
  • 95% 的值落在两个标准差之内。
  • 99.7% 的值落在三个标准差之内。

一个组的样本标准差是该组总体标准差的估计值。标准差用于计算置信区间和 p 值。样本标准差越大,置信区间的精确度越低(越宽),统计的功效也越低。

方差分析假定所有水平的总体标准差相等。如果无法假定等方差,请使用 Welch 方差分析,它属于单因子方差分析的选项。

组均值的置信区间(95% 置信区间)

这些置信区间 (CI) 是可能包含每个总体的实际差分的值范围。置信区间采用合并标准差计算。

由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。

置信区间由以下两部分组成:
点估计值
点估计是从样本数据计算得到的参数的估计值。置信区间集中在此值附近。
边际误差
边际误差定义了置信区间的宽度并由样本、样本数量和置信水平中的观测变异性确定。要计算置信区间的上限,需要将边际误差与点估计相加。要计算置信区间的下限,需要从点估计减去边际误差。

解释

使用置信区间可以评估每个组的总体均值的估计值。

例如,当置信水平为 95% 时,置信区间包含组均值的置信度为 95%。置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。

均值

油漆N均值标准差95% 置信区间
配方 1614.733.36(11.37, 18.10)
配方 268.575.50(5.20, 11.93)
配方 3612.983.73(9.62, 16.35)
配方 4618.072.64(14.70, 21.43)
合并标准差 = 3.95012

在这些结果中,每种混料都具有其平均硬度的置信区间。针对这些数据的多重比较结果显示,混料 4 与混料 2 相比,硬度明显更高。混料 4 比混料 2 更硬并不表示混料 4 的硬度足以用作油漆。组均值的置信区间才是判断混料 4 的硬度是否足够的更有效标准。

合并标准差

合并标准差是对所有水平公共标准差的估计值。合并标准差是所有数据点在其组均值(不是总体均值)附近的标准差。组越大,对合并标准差的总体估计值的影响也会按比例增加。

解释

标准差值越大,数据越分散。值越大,置信区间就越不精确(越宽),统计的功效也越低。

Minitab 使用合并标准差,针对组均值和组均值之间的差分创建置信区间。

合并标准差的示例

假设您的研究有四个组,如下表所示。
均值 标准差 N
1 9.7 2.5 50
2 12.1 2.9 50
3 14.5 3.2 50
4 17.3 6.8 200

前三个组大小相等 (n=50),标准差约为 3。第四个组要大得多 (n=200) 且标准差更大 (6.8)。由于合并标准差使用加权平均值,因此其值 (5.488) 更接近于最大组的标准差。