箱线图提供了每个样本分布的图形汇总。通过箱线图,可以方便地比较样本的形状、集中趋势和变异性。
使用箱线图可以检查数据的散布,还可以确定任何可能的异常值。当样本数量大于 20 时,箱线图最适合。
检查数据的散布以确定数据看上去是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。偏斜数据表明数据可能未呈正态分布。通常情况下,在单值图、直方图或箱线图中最易于检测偏度。
如果您的样本较小(小于 20 个值),严重偏斜的数据可能会影响 p 值的有效性。如果您的数据严重偏斜,并且样本较小,请考虑增大样本数量。
异常值是远离其他数据值的数据值,可能会显著影响您的结果。通常情况下,在箱线图上最容易识别异常值。
尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。
单值图显示每个样本中的单个值。通过单值图,可以很容易地比较样本。每个圆形表示一个观测值。当样本数量较小时,单值图尤为有效。
使用单值图可以检查数据的散布,还可以确定任何可能的异常值。当样本数量小于 50 时,单值图效果最佳。
检查数据的散布以确定数据看上去是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。偏斜数据表明数据可能未遵循正态分布。通常情况下,在单值图、直方图或箱线图中最易于检测偏度。
异常值是远离其他数据值的数据值,可能会显著影响您的结果。通常情况下,在单值图上最容易识别异常值。
尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。
使用区间图可显示每个组的均值和置信区间。
请谨慎解释这些区间,因为进行多重比较时出现类型 I 错误的比率会增加。也就是说,进行的比较越多,至少有一个比较将错误得出其中一个观测差分会显著不同的概率也会越高。
在这些结果中,混料 2 具有最低均值,混料 4 具有最高均值。从图形中不能确定任何差分是否在统计意义上显著。要确定统计显著性,请评估均值差分的置信区间。