单因子方差分析的数据图

请查找相关定义和解释指导,了解每个数据图。

箱线图

箱线图提供了每个样本分布的图形汇总。通过箱线图,可以方便地比较样本的形状、集中趋势和变异性。

解释

使用箱线图可以检查数据的散布,还可以确定任何可能的异常值。当样本数量大于 20 时,箱线图最适合。

偏斜数据

检查数据的散布以确定数据看上去是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。偏斜数据表明数据可能未呈正态分布。通常情况下,在单值图、直方图或箱线图中最易于检测偏度。

右偏斜
左偏斜

带右偏斜数据的箱线图显示平均等待时间。大部分等待时间相对较短,只有少数等待时间较长。带左偏斜数据的箱线图显示故障率数据。少数几个项立即失败,更多的项会在以后失败。

如果您的样本较小(小于 20 个值),严重偏斜的数据可能会影响 p 值的有效性。如果您的数据严重偏斜,并且样本较小,请考虑增大样本数量。

异常值

异常值是远离其他数据值的数据值,可能会显著影响您的结果。通常情况下,在箱线图上最容易识别异常值。

在箱线图上,星号 (*) 表示异常值。

尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。

单值图

单值图显示每个样本中的单个值。通过单值图,可以很容易地比较样本。每个圆形表示一个观测值。当样本数量较小时,单值图尤为有效。

解释

使用单值图可以检查数据的散布,还可以确定任何可能的异常值。当样本数量小于 50 时,单值图效果最佳。

偏斜数据

检查数据的散布以确定数据看上去是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。偏斜数据表明数据可能未遵循正态分布。通常情况下,在单值图、直方图或箱线图中最易于检测偏度。

右偏斜
左偏斜

带右偏斜数据的单值图显示等待时间。大部分等待时间相对较短,只有少数等待时间较长。带左偏斜数据的单值图显示故障时间数据。少数几个项立即失败,更多的项会在以后失败。

异常值

异常值是远离其他数据值的数据值,可能会显著影响您的结果。通常情况下,在单值图上最容易识别异常值。

在单值图上,异常低或异常高的数据值表明可能存在异常值。

尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。

区间图

使用区间图可显示每个组的均值和置信区间。

区间图显示如下内容:
  • 每个点号都代表样本均值。
  • 每个区间针对组均值具有 95% 的单个置信区间。组均值位于组的置信区间内的置信度为 95%。
重要信息

请谨慎解释这些区间,因为进行多重比较时出现类型 I 错误的比率会增加。也就是说,进行的比较越多,至少有一个比较将错误得出其中一个观测差分会显著不同的概率也会越高。

解释

在这些结果中,混料 2 具有最低均值,混料 4 具有最高均值。从图形中不能确定任何差分是否在统计意义上显著。要确定统计显著性,请评估均值差分的置信区间。