解释单值图的主要结果

请完成以下步骤来解释单值图。

步骤 1:评估关键特征

检查分布的中心和散布。评估样本数量对单值图外观的影响。

中心和散布

标识符号的最密集的聚类。最密集的聚类表示最常见的值。评估每个组的散布以了解数据的变异程度。将指针放在描述观测值的工具提示的任何点上。

例如,在塑料管直径的此单值图中,每个星期的散布是递增的。

调查此单值图上任何奇怪的或不需要的特征。例如,对于一批球轴承货物的硬度测量值,单值图的散布宽度比正常值的宽。经过调查发现,是球轴承制造过程的变更导致了变异性增大。

样本数量 (n)

样本数量可能会影响图形的外观。

例如,尽管这两个单值图似乎有相当大的差异,但这两个单值图都是使用从同一个总体中随机选择的数据样本创建的。

当样本数量小于大约 50 时,单值图效果最佳。如果样本太大,图上的数据点可能会聚合得过于密集,可能会使分布很难评估。如果样本数量大于 50,请考虑改用箱线图直方图

步骤 2:查找非正态或异常数据的指示符

偏斜数据和多模态数据表明数据可能不是正态数据。异常值可能表明数据中存在其他情况。

偏斜数据

确定数据是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。偏斜表明数据可能未呈正态分布。通常情况下,在直方图箱线图中最易于检测偏斜。

这些单值图说明的是偏斜数据。带右偏斜数据的单值图显示等待时间。大部分等待时间相对较短,只有少数等待时间很长。带左偏斜数据的单值图显示故障时间数据。少数几个项立即失败,更多的项会在随后失败。

右偏斜
左偏斜

如果已知数据本身未偏斜,请调查可能的原因。如果您希望分析严重偏斜的数据,请阅读该分析的“数据注意事项”主题,以确保您可以使用非正常据。

异常值

异常值是远离其他数据值的数据值,可能会显著影响您的结果。

在单值图上,异常低或异常高的数据值表示可能的异常值。
注意

将指针放在异常值上以标识数据点。

尝试确定导致任何异常值的原因。更正任何测量误差或数据输入错误。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。

多模态数据

多模态数据具有多个聚类(也称为模式)。多模态数据往往表明未考虑到重要变量。

例如,这些单值图是相同数据的图形。简单的单值图包含两个聚类,但它并未清楚地指示聚类的含义。含组的单值图表明,聚类与两个组相对应。

简单
含组

如果您具有其他可用来对观测值进行分组的信息,则可以创建一个包含此信息的组变量。然后,可以创建含组的图形,以确定组变量是否导致数据中的峰值。

提示

要向现有的图形中添加组变量,请在图形中双击数据表示形式,然后单击选项卡。

步骤 3:评估和比较组

如果单值图含组,请评估和比较组的中心和散布。

中心

查找组中心之间的差异。

例如,此单值图显示三个供应商生产的电线的厚度。每个供应商的电线厚度的中心似乎不同。
要确定均值的差值在统计意义上是否显著,请执行以下操作之一:

散布

查找组散布之间的差异。

例如,此单值图显示三条生产线生产的麦片盒的填充重量。尽管重量的分布具有几乎相同的中心,但某些组的重量比其他组的变异性大。
要确定散布(方差)之间的差异在统计意义上是否显著,请执行以下操作之一: