样本数量 (N) 是样本中的观测值总数。
均值使用标识数据中心的单个值来汇总每个样本中的值。均值是按数据的算术平均值计算的,它等于所有观测值的和除以观测值的个数。
检验样本的均值是对检验总体的均值的估计值。参考样本的均值是对参考总体的均值的估计值。因此,样本均值之间的差值(或比值)为检验总体的均值与参考总体的均值之间的差值(或比值)提供了估计值。
由于估计值基于样本数据而非整个总体,因此您不能确定它是否等于总体之间的差值(或比率)。要评估总体估计值的精确度,可以使用置信区间。
标准差 (StDev) 是离差的最常用度量,即数据与均值的接近程度。对某一过程而言随机或合乎自然规律的变异通常称为噪声。
标准差与数据采用相同的单位。符号 σ(西格玛)常用来表示总体的标准差。字母 s 用来表示样本的标准差。
使用标准差可以确定数据从均值扩散的程度。
样本数据的标准差是对总体标准差的估计值。值越高,数据中的变异或“噪声”越多。标准差用于计算置信区间和 p 值。值越高,置信区间越宽,统计功效越低。
均值的标准误(SE 均值)估计样本均值之间的变异性,样本均值是在对相同总体重复抽样的情况下获得的。而均值的标准误估计样本之间的变异性,标准差度量单个样本内的变异性。
例如,根据 312 个交货时间的随机样本,得到平均交货时间为 3.80 天,标准差为 1.43 天。这些数字产生的均值标准误为 0.08 天(1.43 除以 312 的平方根)。如果从相同总体中抽取大小相同的多个随机样本,则这些不同样本均值的标准差将大约为 0.08 天。
使用均值的标准误可以确定样本均值对总体均值的估计精确度。
均值的标准误越小,对总体均值的估计越精确。通常,标准差越大,均值的标准误就越大,对总体均值的估计也越不精确。样本越大,均值的标准误就越小,对总体均值的估计也越精确。
Minitab 使用均值的标准误来计算置信区间。
合并标准差是对两个样本的公共标准差的估计值。合并标准差是所有数据点在其组均值(不是总体均值)附近的标准差。组越大,对合并标准差的总体估计值的影响也会按比例增加。
当您假定检验的等方差时,Minitab 会计算合并标准差。
合并标准差用于计算标准误、置信区间和 p 值。
标准差越大,数据越分散。值越大,置信区间就越不精确(越宽),检验的性能也越低。