等方差的检验是评估有关两个或更多总体标准差的两个相互独立语句的假设检验。这两个语句被称为原假设和备择假设。假设检验使用样本数据来确定是否要否定原假设。
将 p 值与显著性水平相比较,以确定是否要否定原假设。
样本数量 (N) 是每个组中的观测值总数。
样本数量影响置信区间和检验功效。
通常,数量较大的样本将产生较窄的置信区间。样本数量越大,检验检测到差分的功效越大。
标准差是离差的最常用度量,即数据从均值扩散的程度。符号 σ(西格玛)常用来表示总体的标准差。符号 s 用来表示样本的标准差。
标准差与变量采用相同的单位。标准差值越大,数据越分散。数据服从正态分布的准则为:约 68% 的值位于均值的一个标准差范围内,95% 的值位于两个标准差范围内,并且 99.7% 的值位于三个标准差范围内。
使用 Bonferroni 置信区间可基于类别因子,估计每个总体的标准差。每个置信区间都是可能包含相应总体标准差的可能值的范围。Minitab 通过调整 Bonferroni 置信区间来保持同时置信水平。
当评估多个置信区间时,控制同时置信水平尤其重要。如果您不控制同时置信水平,至少一个置信区间不会包含实际标准差的几率会随着置信区间的数量增加而增加。
有关更多信息,请转到了解多重比较中的单个置信水平和同时置信水平,以及什么是 Bonferroni 方法?。
您无法使用这些 Bonferroni 置信区间来确定组对之间的差异是否统计意义显著。使用汇总图上的 p 值和多重比较置信区间来确定差异是否统计意义显著。
原假设 | 所有方差都相等 |
---|---|
备择假设 | 至少有一个方差不同 |
显著性水平 | α = 0.05 |
化肥 | N | 标准差 | 置信区间 |
---|---|---|---|
GrowFast | 50 | 4.28743 | (3.43659, 5.61790) |
无 | 50 | 5.09137 | (4.24793, 6.40914) |
SuperPlant | 49 | 5.49969 | (4.48577, 7.08914) |
在这些结果中,95% 的 Bonferroni 置信区间表明整个置信区间集包含所有组的实际总体标准差的置信度为 95%。此外,单个置信水平表明单个置信区间包含该特定组的总体标准差的的置信度。例如,置信区间 (3.43659, 5.61790) 内,GrowFast 总体标准差的置信度可能为 98.3333%。
在反复执行研究的情况下,单个置信水平是一个置信区间包含特定组的实际标准差的的次数百分比。
随着集中的置信区间数量的增加,至少一个置信区间不会包含实际标准差的几率会增加。同时置信水平表明整个置信区间集包含所有组的实际总体标准差的置信度。
原假设 | 所有方差都相等 |
---|---|
备择假设 | 至少有一个方差不同 |
显著性水平 | α = 0.05 |
化肥 | N | 标准差 | 置信区间 |
---|---|---|---|
GrowFast | 50 | 4.28743 | (3.43659, 5.61790) |
无 | 50 | 5.09137 | (4.24793, 6.40914) |
SuperPlant | 49 | 5.49969 | (4.48577, 7.08914) |
各个置信区间包含特定组实际标准差的的置信度可能为 98.3333%。例如,GrowFast 总体标准差处于置信区间 (3.43659, 5.61790) 内的置信度可能为 98.3333%。但是,由于集包含三个置信区间,因此所有区间都包含实际值的置信度仅为 95%。
Minitab 显示的等方差检验类型取决于您是否在选项子对话框中选择了根据正态分布使用检验以及数据中的组数量。
如果未选择根据正态分布使用检验,Minitab 会同时显示多重比较方法和 Levene 方法的检验结果。对于大多数连续分布,两种方法都可以给出与显著性水平(表示为 α 或 alpha)接近的类型 1 误差率。多重比较方法通常更加有效。如果多重比较方法的 p 值显著,则您可以使用汇总图来确定标准差彼此不同的特定总体。
如果多重比较检验的 p 值低于您选择的显著性水平,则部分标准差之间的差分统计意义显著。使用多重比较区间可确定哪些标准差彼此之间显著不同。如果两个区间没有重叠,则相应的标准差(和方差)可能有显著差异。
当您具有来自非常偏斜的分布或重尾部型分布的小型样本时,多重比较方法的 I 类误差率可能比 α 高。在这种情况下,如果 Levene 方法可为您提供比多重比较方法更小的 p 值,则应采用 Levene 方法得出结论。
如果选择根据正态分布使用检验且具有两个组,Minitab 将执行 F 检验。如果具有 3 个或更多组,Minitab 将执行 Bartlett 检验。
F 检验和 Bartlett 检验仅对于正态分布数据准确。一旦偏离正态性,就会导致此检验生成不准确的结果。但是,如果数据服从正态分布,则 F 检验和 Bartlett 检验通常比多重比较方法和 Levene 方法更有效。
如果检验的 p 值小于显著性水平,则部分标准差之间的差分统计意义显著。
多重比较检验不使用检验统计量。
Minitab 使用检验统计量计算 p 值,使用 p 值可以做出有关标准差之间差值的统计显著性的决定。p 值是一个概率,用来度量否定原假设的证据。概率越低,否定原假设的证据越充分。
如果检验统计量足够高,则表示部分标准差之间至少有一个差值在统计意义上显著。
可以使用检验统计量来确定是否要否定原假设。但是,P 值更常用,因为它更容易解释。
P 值是一个概率,用来度量否定原假设的证据。概率越低,否定原假设的证据越充分。
使用 p 值来确定标准差之间的任何差值是否统计意义显著。Minitab 显示了用于评估等方差的一个或两个检验的结果。如果您有两个 p 值且它们不一致,请参见“检验”。
要确定标准差之间的任何差值是否统计意义显著,请将 p 值与显著性水平进行比较以评估原假设。原假设声明组均值均相等。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在差异时得出存在差异的风险为 5%。
汇总图显示了等方差检验的 p 值和置信区间。Minitab 显示的检验和区间类型取决于您是否在选项对话框中选择了根据正态分布使用检验以及数据中的组数量。
如果未选择根据正态分布使用检验,汇总图将同时显示多重比较方法和 Levene 方法的 p 值。该图还显示了多重比较区间。您必须基于数据属性,在两种方法之间进行选择。
如果选择了根据正态分布使用检验且具有两个组,Minitab 将执行 F 检验。如果具有 3 个或更多组,Minitab 将执行 Bartlett 检验。对于任意一个检验,该图还显示了 Bonferroni 置信区间。
P 值是一个概率,用来测量否定原假设的证据。概率越低,否定原假设的证据越充分。
使用 p 值来确定标准差之间的任何差分是否统计意义显著。Minitab 显示了用于评估等方差的一个或两个检验的结果。如果具有两个 p 值,且它们不一致,请参见“检验”部分以获取有关使用哪个检验的信息。
要确定标准差之间的任何差分是否统计意义显著,请将 p 值与显著性水平进行比较以评估原假设。原假设表明了所有均相等的组标准差。通常,显著性水平(用 α 或 alpha 表示)为 .05 即可。显著性水平 .05 指示在实际上不存在差异时得出存在差异的风险为 5%。
如果未选择根据正态分布使用检验,汇总图将显示多重比较区间。
如果使用多重比较 p 值较为有效,您可以使用多重比较置信区间来确定其差分统计意义显著的特定组对。如果两个区间未重叠,则相应标准差之间的差分统计意义显著。
如果数据属性要求您使用 Levene 方法,请勿评估汇总图的置信区间。
如果选择了根据正态分布使用检验,汇总图将显示 Bonferroni 置信区间。
使用 Bonferroni 置信区间可估计类别因子的每个总体的标准差。每个置信区间都是可能包含相应总体标准差的值范围。Minitab 通过调整 Bonferroni 置信区间来控制同时置信水平。
当评估多个置信区间时,控制同时置信水平尤其重要。如果您不控制同时置信水平,至少一个置信区间不会包含实际标准差的几率会随着置信区间的数量增加而增加。
有关更多信息,请转到了解多重比较中的单个置信水平和同时置信水平,以及什么是 Bonferroni 方法?
您无法使用这些 Bonferroni 置信区间来确定组对之间的差异是否统计意义显著。使用汇总图上的 p 值和多重比较置信区间来确定差异是否统计意义显著。
单值图显示每个样本中的单个值。通过单值图,可以很容易地比较样本。每个圆形表示一个观测值。当样本数量较小时,单值图尤为有效。
使用单值图可以检查数据的散布,还可以确定任何可能的异常值。当样本数量小于 50 时,单值图效果最佳。
检查数据的散布以确定数据看上去是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。偏斜数据表明数据可能未遵循正态分布。通常情况下,在单值图、直方图或箱线图中最易于检测偏度。
异常值是远离其他数据值的数据值,可能会显著影响您的结果。通常情况下,在单值图上最容易识别异常值。
尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。
箱线图提供了每个样本分布的图形汇总。通过箱线图,可以方便地比较样本的形状、集中趋势和变异性。
使用箱线图可以检查数据的散布,还可以确定任何可能的异常值。当样本数量大于 20 时,箱线图最适合。
检查数据的散布以确定数据看上去是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。偏斜数据表明数据可能未呈正态分布。通常情况下,在单值图、直方图或箱线图中最易于检测偏度。
如果您的样本较小(小于 20 个值),严重偏斜的数据可能会影响 p 值的有效性。如果您的数据严重偏斜,并且样本较小,请考虑增大样本数量。
异常值是远离其他数据值的数据值,可能会显著影响您的结果。通常情况下,在箱线图上最容易识别异常值。
尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。