样本数量 (N) 是每个组中的观测值总数。
样本数量影响置信区间和检验功效。
通常,数量较大的样本将产生较窄的置信区间。样本数量越大,检验检测到差分的功效越大。
每个组中的观测值均值。均值使用确定数据中心的单个值来描述每个组。只需用组的所有观测值的和除以组中的观测值个数即可得出该值。
每个样本的均值提供了每个总体均值的估计值。样本均值之间的差分是总体均值之间差分的估计值。
由于组均值之间的差分均基于样本数据而不是整个总体,因此您不能确定它是否等于总体差分。为更好地了解总体差分,可以使用置信区间。
使用分组信息表可快速确定任何组对之间的均值差分在统计意义上是否显著。
分组列包含对因子水平进行分组的字母。不共享字母的组具有统计意义显著的均值差分。
如果表确定这些差分在统计意义上显著,将使用差分的置信区间来确定差分在实际意义上是否显著。
油漆 | N | 均值 | 分组 | |
---|---|---|---|---|
配方 4 | 6 | 18.07 | A | |
配方 1 | 6 | 14.73 | A | B |
配方 3 | 6 | 12.98 | A | B |
配方 2 | 6 | 8.57 | B |
在这些结果中,表显示组 A 包含混料 1、3 和 4,组 B 包含混料 1、2 和 3。混料 1 和混料 3 处于两个组中。共享一个字母的均值之间的差分在统计意义上不显著。混料 2 和混料 4 不共享一个字母,这表明混料 4 的均值比混料 2 的均值明显高很多。
使用单个置信区间来确定组均值之间的差分是否统计意义显著,以确定差分的可能范围,并确定差分是否实际意义显著。Fisher 的单独检验表显示均值对之间差分的一组置信区。
在反复执行研究的情况下,单个置信水平是单个置信区间包含一对组均值间实际差分的次数的百分比。单个置信区间仅对 Fisher 法可用。所有其他比较方法生成整体置信区间。
控制单个置信水平并不通用,因为它无法控制整体置信水平,这通常会提高不可接受的水平。如果您没有控制同步置信水平,则至少有一个置信区间不包含实际差分的概率会随着比较次数的增加而提高。
差分的置信区间由以下两部分组成:
使用置信区间可评估组均值之间的差分。
水平的差值 | 均值差值 | 差值标准误 | 95% 置信区间 | T 值 | 调整的 P 值 |
---|---|---|---|---|---|
配方 2 - 配方 1 | -6.17 | 2.28 | (-10.92, -1.41) | -2.70 | 0.014 |
配方 3 - 配方 1 | -1.75 | 2.28 | (-6.51, 3.01) | -0.77 | 0.452 |
配方 4 - 配方 1 | 3.33 | 2.28 | (-1.42, 8.09) | 1.46 | 0.159 |
配方 3 - 配方 2 | 4.42 | 2.28 | (-0.34, 9.17) | 1.94 | 0.067 |
配方 4 - 配方 2 | 9.50 | 2.28 | (4.74, 14.26) | 4.17 | 0.000 |
配方 4 - 配方 3 | 5.08 | 2.28 | (0.33, 9.84) | 2.23 | 0.037 |
此值是两个组的样本均值之间的差分。
组的样本均值之间的差分是这些组的总体之间的差分估计值。
由于每个均值差分均基于样本数据而不是整个总体,因此您不能确定它是否等于总体差分。为更好地理解总体均值之间的差分,请使用置信区间。
如果从同一总体中反复提取样本,则均值之间的差分标准误(差分 SE)会估计您将获取的样本均值之间差分的变异性。
使用均值之间的差分标准误可确定样本均值之间差分的精确程度,从而估计总体均值之间的差分。标准误的值越低,表明估计值越精确。
Minitab 使用差分标准误来计算均值之间差分的置信区间,它是可能包含总体差分的值范围。
使用差分的整体置信区间(95% 置信区间)可确定均值差分是否在统计意义上显著,从而确定差分的可能范围以及评估差分的实际显著性。表格会显示均值对之间差分的一组置信区间。不包含零的置信区间表示统计意义显著的均值差分。
在多次反复执行研究的情况下,整体置信水平是一组置信区间包含所有组比较值之间实际差分的次数所占的百分比。
在执行多重比较时,控制整体置信水平尤其重要。如果您没有控制同步置信水平,则至少有一个置信区间不包含实际差分的概率会随着比较次数的增加而提高。
差分的置信区间由以下两部分组成:
使用置信区间可评估组均值之间的差分。
水平的差值 | 均值差值 | 差值标准误 | 95% 置信区间 | T 值 | 调整的 P 值 |
---|---|---|---|---|---|
配方 2 - 配方 1 | -6.17 | 2.28 | (-12.55, 0.22) | -2.70 | 0.061 |
配方 3 - 配方 1 | -1.75 | 2.28 | (-8.14, 4.64) | -0.77 | 0.868 |
配方 4 - 配方 1 | 3.33 | 2.28 | (-3.05, 9.72) | 1.46 | 0.478 |
配方 3 - 配方 2 | 4.42 | 2.28 | (-1.97, 10.80) | 1.94 | 0.245 |
配方 4 - 配方 2 | 9.50 | 2.28 | (3.11, 15.89) | 4.17 | 0.002 |
配方 4 - 配方 3 | 5.08 | 2.28 | (-1.30, 11.47) | 2.23 | 0.150 |
T 值是一个检验统计量,用来测量均值差值与差值标准误之间的比值。
您可以使用 t 值来确定是否要否定原假设,这表明均值差分为 0。但是,大多数人使用 p 值,因为它更易于解释。有关使用临界值的更多信息,请转到使用 t 值来确定是否要否定原假设。
Minitab 使用 t 值计算 p 值。
调整的 p 值表明全族比较中的哪些对显著不同。调整会将全族误差率限制为您指定的 alpha 水平。如果为多重比较使用常规 p 值,则全族误差率会随每个附加比较而增加。
进行多重比较时考虑全族误差率很重要,因为对于一系列比较而言,发生类型 I 错误的几率比单独进行任何一个比较的误差率都要高。
如果调整的 p 值小于 alpha,则否定原假设并得出一对组均值的差值在统计意义上显著。调整的 p 值还表示拒绝特定原假设时的最小全族误差率。
使用置信区间可确定差分的可能范围并评估差分的实际显著性。图形会显示均值对之差的一组置信区间。不包含零的置信区间表示统计意义显著的均值差分。
根据您选择的比较方法,图会比较不同的组对并显示下列置信区间类型之一。
单个置信水平
在多次反复执行研究的情况下,单个置信区间将包含一对组均值间实际差分的次数的百分比。
整体置信水平
在多次反复执行研究的情况下,一组置信区间将包含所有组比较实际差分的次数的百分比。
在执行多重比较时,控制整体置信水平尤其重要。如果您没有控制整体置信水平,则至少有一个置信区间不包含实际差分的概率会随着比较次数的增加而提高。
水平的差值 | 均值差值 | 差值标准误 | 95% 置信区间 | T 值 | 调整的 P 值 |
---|---|---|---|---|---|
配方 2 - 配方 1 | -6.17 | 2.28 | (-12.55, 0.22) | -2.70 | 0.061 |
配方 3 - 配方 1 | -1.75 | 2.28 | (-8.14, 4.64) | -0.77 | 0.868 |
配方 4 - 配方 1 | 3.33 | 2.28 | (-3.05, 9.72) | 1.46 | 0.478 |
配方 3 - 配方 2 | 4.42 | 2.28 | (-1.97, 10.80) | 1.94 | 0.245 |
配方 4 - 配方 2 | 9.50 | 2.28 | (3.11, 15.89) | 4.17 | 0.002 |
配方 4 - 配方 3 | 5.08 | 2.28 | (-1.30, 11.47) | 2.23 | 0.150 |