解释 双方差 的主要结果

请完成以下步骤来解释双方差检验。主要输出包括比值、置信区间、p 值和多个图形。

步骤 1:确定标准差或方差的比值的置信区间

首先考虑样本方差或样本标准差的比值,然后检查置信区间。

样本数据标准差和方差的估计比值是对总体标准差和方差中比值的估计值。由于估计的比值基于样本数据而不是整个总体,因此样本比值通常不等于总体比值。使用置信区间可以更好地估计比值。

置信区间提供总体方差或标准差之间比值的可能值范围。例如,95% 的置信水平表明,如果从总体中随机抽取 100 个样本,则大约 95 个样本将产生包含总体比值的区间。置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情况有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。有关更多信息,请转到获得更加精确的置信区间的方法

默认情况下,双方差检验将显示 Levene 方法和 Bonett 方法的结果。Bonett 方法通常比 Levene 方法更可靠。但对于严重偏斜和重尾的分布,Levene 方法通常比 Bonett 方法更可靠。只有当您确信数据服从正态分布时,才使用 F 检验。与正态性的任何微小偏差都可能会大大影响 F 检验的结果。有关更多信息,请转到对于双方差,应使用 Bonett 方法还是 Levene 方法?

汇总图将显示比值的置信区间,以及标准差或方差的置信区间。

标准差比

估计的比值使用 Bonett 的比值的
95% 置信区间
使用 Levene 的比值的
95% 置信区间
0.658241(0.372, 1.215)(0.378, 1.296)
主要结果:估计的比值、比值的置信区间、汇总图

在这些结果中,两家医院评分的总体标准差比值的估计值为 0.658。通过使用 Bonett 方法,医院评分的总体标准差的比值介于 0.372 和 1.215 之间的可信度为 95%。

步骤 2:确定比值在统计意义上是否显著

要确定总体标准差或方差的差值在统计意义上是否显著,请将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在差值时得出存在差值的风险为 5%。
P 值 ≤ α:标准差或方差的比值在统计意义上显著(否定 H0
如果 p 值小于或等于显著性水平,则决策为否定原假设。您可以得出总体标准差或方差的比值不等于假设比值的结论。如果您没有指定假设比值,Minitab 将检验标准差或方差之间是否不存在差值(假设比值 = 1)。请使用您的专业知识确定差值在实际意义上是否显著。有关更多信息,请转到统计显著性和实际显著性
P 值 > α:标准差或方差的比值在统计意义上不显著(无法否定 H0
如果 p 值大于显著性水平,则决策为无法否定原假设。您没有足够的证据得出总体标准差或方差的比值在统计意义上显著的结论。您应该确保检验具有足够的功效来检测到在实际意义上显著的差值。有关更多信息,请转到双方差的功效和样本数量
默认情况下,双方差检验将显示 Levene 方法和 Bonett 方法的 p 值。如果将该检验用于正态分布,Minitab 将显示 F 检验的 p 值。请根据数据分布属性选择一种检验,如下所示:
  • Bonett 检验对于任何连续分布都是准确的,并且不要求数据为正态数据。Bonett 检验通常比 Levene 检验更可靠。
  • Levene 检验对于任何连续分布也是准确的。对于极其偏斜和重尾的分布,Levene 方法可能比 Bonett 方法更可靠。
  • F 检验仅对于正态分布数据是准确的。只要稍微偏离正态性,都可能会导致 F 检验不准确,即便使用大样本也是如此。但是,如果数据很好地遵循了正态分布,则 F 检验通常比 Bonett 方法或 Levene 方法的功效更好。

有关更多信息,请转到对于双方差,应使用 Bonett 方法还是 Levene 方法?

检验

原假设H₀: σ₁ / σ₂ = 1
备择假设H₁: σ₁ / σ₂ ≠ 1
显著性水平α = 0.05
方法检验统计量DF1DF2P 值
Bonett2.091 0.148
Levene1.601380.214
主要结果:P 值

在这些结果中,原假设声明两家医院的评分标准差之间的比值为 1。由于两个 p 值都大于显著性水平 0.05,因此无法否定原假设且无法得出两家医院的评分之间的标准差不同的结论。

步骤 3:检查数据是否有问题

您数据中存在的问题(如偏度和异常值)可对结果产生不利影响。可使用图形来查找偏度(通过检查每个样本的散布)以及确定可能的异常值。

检查数据的散布以确定数据看上去是否偏斜。

当数据偏斜时,大多数数据位于图形的高或低侧。通常情况下,在直方图或箱线图中最易于检测偏度。

右偏斜
左偏斜

带右偏斜数据的直方图显示等待时间。大部分等待时间相对较短,只有少数等待时间很长。带左偏斜数据的直方图显示失效时间数据。少数几个项立即失败,更多的项会在随后失败。

如果样本小(小于 20 个值),则严重偏斜的数据可影响 p 值的有效性。如果您的数据严重偏斜,并且样本较小,请考虑增大样本数量。

在这些直方图中,数据的偏斜程度似乎不严重。

识别异常值

异常值是远离其他数据值的数据值,可以显著影响您的分析结果。通常情况下,在箱线图上最容易识别异常值。

在箱线图上,星号 (*) 表示异常值。

尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。有关更多信息,请转到标识异常值

在汇总图上的箱线图中,医院 B 有两个异常值。