解释茎叶图的主要结果

请完成以下步骤来解释茎叶图。

步骤 1:评估主要特征

检查分布的中心和散布。评估样本数量对茎叶图外观的可能影响。

中心和散布

检查以下元素可深入了解样本数据的中心和散布。
计数和中位数
计数位于左侧的第一列中。包含中位数值的行的计数用括号括起来。中位数上面和下面行的值为累积值。中位数以上行的计数表示该行及其以上所有行的总计数。中位数以下行的值表示该行及其以下所有行的总计数。
数据值

对于每一行,“茎”(中间列)中的数字表示样本值的第一位(或前几位)。茎叶图顶部的“叶单元”指示叶值表示的小数位。

散布
散布显示数据的变异量。

茎叶图显示客户等待与代表进行在线客户服务聊天的时间。第一行包含茎值 8、叶值 0、2 和 3。叶单元为 1。因此,茎叶图的第一行表示大约为 80、82 和 83 的样本值。值介于 80 秒和 119 秒之间。中位数位于其值在 95 秒和 99 秒之间的行中。

C1 的茎叶图   N = 50

38023
8856688
2190111111222444
(6)9555799
23100000111233
131055667789
51114
311579
叶单位 = 1

调查任何奇怪的或不想要的特征。例如,客户等待时间的茎叶图显示值和散布高于预期。经调查显示,不稳定性和延迟是由异常高的 Web 流量导致的。

样本数量 (n)

样本数量可能会影响图形的外观。

样本数量显示在茎叶图的顶部。在上一个示例中,样本数量为 50 (N = 50)。

由于每个茎叶图表示一个数据值,因此当样本数量小于大约 50 时,茎叶图效果最佳。如果样本数量大于 50,则图上的数据点可能会延伸到太远的位置,这可能会使得分布很难评估。如果您的数据点多于 50 个,请考虑使用箱线图直方图

步骤 2:查找非正态或异常数据的指示符

偏斜数据和多模态数据表明数据可能不是正态数据。异常值可能表明数据中存在其他情况。

偏斜数据

确定数据是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。偏斜表明数据可能未呈正态分布。通常情况下,在直方图箱线图中最易于检测偏斜。

这些茎叶图说明的是偏斜数据。带右偏斜数据的茎叶图显示等待时间。大部分等待时间相对较短,只有少数等待时间很长。带左偏斜数据的茎叶图显示失效时间数据。少数几个项立即失效,更多的项则在随后失效。

C1 的茎叶图   N = 50

1-04
6-033222
16-01111111111
(16)00000000011111111
18022222333333
704555
306
20 
21 
212
114
叶单位 = 0.1

右偏斜

C1 的茎叶图   N = 52

3-1333
3-1 
5-099
6-06
8-044
24-03333333322222222
(7)-01111111
210000001111111
9022233
40445
106
叶单位 = 0.1

左偏斜

如果已知数据本身未偏斜,请调查可能的原因。如果您希望分析严重偏斜的数据,请阅读该分析的“数据注意事项”主题,以确保您可以使用非正常据。

异常值

异常值是远离其他数据值的数据值,可能会显著影响您的结果。

在茎叶图上,末端的独立值标识可能的异常值。例如,此图底部的最后一个值可能是异常值。

C1 的茎叶图   N = 31

2-220
4-152
(13)-08886555433300
14000334688
610046
225
13 
14 
15 
16 
17 
180
叶单位 = 0.1

尝试确定导致任何异常值的原因。更正任何测量误差或数据输入错误。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。

多模态数据

多模态数据具有多个峰值。(峰值表示一组数据的模式。)如果数据是从多个过程中或在多个条件(如多个温度)下收集的,通常会出现多模态数据。

例如,这些茎叶图是相同数据的图形。简单的茎叶图包含两个点聚类,但它并未清楚地指示聚类均值的含义。含组的茎叶图表明,聚类与两个组相对应。

C1 的茎叶图   N = 100

2718
58589
2190122235555677889
37100122233334556778
(14)1113334455667789
49122599
45130012334667778888888
2614000011122236777888
8150245779
1161
叶单位 = 0.1

简单

C1 的茎叶图    C2 = 1    N = 50

21159
512259
24130012334667778888888
(18)14000011122236777888
8150245779
1161
叶单位 = 0.1

C1 的茎叶图    C2 = 2    N = 50

2718
58589
2190122235555677889
(16)100122233334556778
1311133344566778
1129
叶单位 = 0.1

含组

如果您具有其他可用来对观测值进行分组的信息,则可以创建一个包含此信息的组变量。然后,可以创建含组的图形,以确定组变量是否导致数据中的峰值。