检查分布的中心和散布。评估样本数量对单值图外观的影响。
标识符号的最密集的聚类。最密集的聚类表示最常见的值。评估每个组的散布以了解数据的变异程度。将指针放在描述观测值的工具提示的任何点上。
调查此单值图上任何奇怪的或不需要的特征。例如,对于一批球轴承货物的硬度测量值,单值图的散布宽度比正常值的宽。经过调查发现,是球轴承制造过程的变更导致了变异性增大。
偏斜数据和多模态数据表明数据可能不是正态数据。异常值可能表明数据中存在其他情况。
异常值是远离其他数据值的数据值,可能会显著影响您的结果。
将指针放在异常值上以标识数据点。
尝试确定导致任何异常值的原因。更正任何测量误差或数据输入错误。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。
多模态数据具有多个聚类(也称为模式)。多模态数据往往表明未考虑到重要变量。
例如,这些单值图是相同数据的图形。简单的单值图包含两个聚类,但它并未清楚地指示聚类的含义。含组的单值图表明,聚类与两个组相对应。
如果您具有其他可用来对观测值进行分组的信息,则可以创建一个包含此信息的组变量。然后,可以创建含组的图形,以确定组变量是否导致数据中的峰值。
要向现有的图形中添加组变量,请在图形中双击数据表示形式,然后单击组选项卡。
如果单值图含组,请评估和比较组的中心和散布。