解释茎叶图的主要结果

请完成以下步骤来解释茎叶图。

步骤 1:评估主要特征

检查分布的中心和散布。评估样本数量对茎叶图外观的可能影响。

中心和散布

检查以下元素可深入了解样本数据的中心和散布。
计数和中位数
计数位于左侧的第一列中。包含中位数值的行的计数用括号括起来。中位数上面和下面行的值为累积值。中位数以上行的计数表示该行及其以上所有行的总计数。中位数以下行的值表示该行及其以下所有行的总计数。
数据值

对于每一行,“茎”(中间列)中的数字表示样本值的第一位(或前几位)。茎叶图顶部的“叶单元”指示叶值表示的小数位。

散布
散布显示数据的变异量。
茎叶图显示客户等待与代表进行在线客户服务聊天的时间。第一行包含茎值 8、叶值 0、2 和 3。叶单元为 1。因此,茎叶图的第一行表示大约为 80、82 和 83 的样本值。值介于 80 秒和 119 秒之间。中位数位于其值在 95 秒和 99 秒之间的行中。
C1 的茎叶图 N = 50 3 8 023 8 8 56688 21 9 0111111222444 (6) 9 555799 23 10 0000111233 13 10 55667789 5 11 14 3 11 579 叶单位 = 1

调查任何奇怪的或不想要的特征。例如,客户等待时间的茎叶图显示值和散布高于预期。经调查显示,不稳定性和延迟是由异常高的 Web 流量导致的。

样本数量 (n)

样本数量可能会影响图形的外观。

样本数量显示在茎叶图的顶部。在上一个示例中,样本数量为 50 (N = 50)。

由于每个茎叶图表示一个数据值,因此当样本数量小于大约 50 时,茎叶图效果最佳。如果样本数量大于 50,则图上的数据点可能会延伸到太远的位置,这可能会使得分布很难评估。如果您的数据点多于 50 个,请考虑使用箱线图直方图

步骤 2:查找非正态或异常数据的指示符

偏斜数据和多模态数据表明数据可能不是正态数据。异常值可能表明数据中存在其他情况。

偏斜数据

确定数据是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。偏斜表明数据可能未呈正态分布。通常情况下,在直方图箱线图中最易于检测偏斜。

这些茎叶图说明的是偏斜数据。带右偏斜数据的茎叶图显示等待时间。大部分等待时间相对较短,只有少数等待时间很长。带左偏斜数据的茎叶图显示失效时间数据。少数几个项立即失效,更多的项则在随后失效。

茎叶图显示: C1

C1 的茎叶图 N = 50 1 -0 4 6 -0 33222 16 -0 1111111111 (16) 0 0000000011111111 18 0 22222333333 7 0 4555 3 0 6 2 0 2 1 2 1 2 1 1 4 叶单位 = 0.1
右偏斜

茎叶图显示: C1

C1 的茎叶图 N = 52 3 -1 333 3 -1 5 -0 99 6 -0 6 8 -0 44 24 -0 3333333322222222 (7) -0 1111111 21 0 000001111111 9 0 22233 4 0 445 1 0 6 叶单位 = 0.1
左偏斜

如果已知数据本身未偏斜,请调查可能的原因。如果您希望分析严重偏斜的数据,请阅读该分析的“数据注意事项”主题,以确保您可以使用非正常据。

异常值

异常值是远离其他数据值的数据值,可能会显著影响您的结果。

在茎叶图上,末端的独立值标识可能的异常值。例如,此图底部的最后一个值可能是异常值。

茎叶图显示: C1

C1 的茎叶图 N = 31 2 -2 20 4 -1 52 (13) -0 8886555433300 14 0 00334688 6 1 0046 2 2 5 1 3 1 4 1 5 1 6 1 7 1 8 0 叶单位 = 0.1

尝试确定导致任何异常值的原因。更正任何测量误差或数据输入错误。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。

多模态数据

多模态数据具有多个峰值。(峰值表示一组数据的模式。)如果数据是从多个过程中或在多个条件(如多个温度)下收集的,通常会出现多模态数据。

例如,这些茎叶图是相同数据的图形。简单的茎叶图包含两个点聚类,但它并未清楚地指示聚类均值的含义。含组的茎叶图表明,聚类与两个组相对应。

茎叶图显示: C1

C1 的茎叶图 N = 100 2 7 18 5 8 589 21 9 0122235555677889 37 10 0122233334556778 (14) 11 13334455667789 49 12 2599 45 13 0012334667778888888 26 14 000011122236777888 8 15 0245779 1 16 1 叶单位 = 0.1
简单

茎叶图显示: C1

C1 的茎叶图    C2 = 1    N = 50 2 11 59 5 12 259 24 13 0012334667778888888 (18) 14 000011122236777888 8 15 0245779 1 16 1 叶单位 = 0.1
C1 的茎叶图    C2 = 2    N = 50 2 7 18 5 8 589 21 9 0122235555677889 (16) 10 0122233334556778 13 11 133344566778 1 12 9 叶单位 = 0.1
含组

如果您具有其他可用来对观测值进行分组的信息,则可以创建一个包含此信息的组变量。然后,可以创建含组的图形,以确定组变量是否导致数据中的峰值。