使用箱线图评估并比较样本分布的形状、集中趋势和变异性,并查看异常值。当样本数量最少为 20 时,箱线图效果最佳。

有关数据注意事项、示例和说明的信息,请转到箱线图的概述

连续变量

输入一个或多个要为其绘制图形的数字列。

类别变量(可选)

最多输入五列用来定义组的类别数据。第一个变量是尺度上的最外层,最后一个变量是最内层。

布局

选择以下布局选项之一。

每个连续变量的单独图形
连续变量字段中的每个列创建一个单独的箱线图。
重叠连续变量
连续变量字段中的列覆盖在单个箱线图上。

分组变量

分组变量 中输入一个或多个分组变量,为分组变量的每个水平创建一个单独的箱线图。您可以输入的列可以是数字或文本列,必须与在连续变量类别变量中输入的列具有相同的长度。每个变量的 y 尺度在多个箱线图上是相同的。
显示所有组合

当您输入多个 分组变量 时,Minitab 启用 显示所有组合 复选框。选择此选项,为 By 变量创建的组的每个组合创建单独的箱线图。如果您没有选择此选项,Minitab 会为每个 By 变量的每个组创建一个图。

例如,第一个 By 变量有 2 组(“男性”和“女性”),第二个 By 变量有 2 组(“就业”和“失业”)。如果您选择 显示所有组合,Minitab 为“男性/就业”、“男性/失业”、“女性/就业”和“女性/失业”组合创建 4 个单独的图。如果您不选择 显示所有组合,Minitab 为“男性”、“女性”、“就业”和“失业”创建 4 个单独的箱线图。

须触线和异常值

须从箱子的任一侧延伸。须表示下 25% 和上 25% 的数据值的范围,不包括异常值。

抖散异常值
如果图形中有相同的数据值,则异常值符号可能会相互遮盖。选择此选项来轻微移动符号以显示重叠点。

自定义百分位数

使用异常值常见的大型数据集时,您可以显示自定义百分位数,而非异常值来收集有关数据的更多信息。自定义百分位数发生在四分位数框之外,通常发生在分布的尾部。此外,百分位数线置于最小值和最大值上。默认情况下,这些百分位数值为 0.5、2.5、10、90、97.5 和 99.5,但您可以添加、删除或更改它们。

Y 尺度

选择要显示 y 尺度的方式。

原始单位
使用数字变量的原始测量单位。
标准化单位
将不同的测量单位转换为标准单位,使数字变量具有可比性。
相同的 Y 尺度
在多个图形中使用相同的 Y 尺度。

变量显示顺序

对于图形上所显示的组,Minitab 使用“最内层”和“最外层”这两个词来指示多个水平的尺度的相对位置。对于水平尺度,最外层是指图形底部的尺度,最内层是指离底部最远的尺度(离水平轴最近)。对于垂直尺度,最外层是指最左侧的尺度,最内层是指离垂直轴最近的尺度。

当您有多个带有组的 Y 变量时,选择以下选项之一。

首先为类别变量,Y 在下方
图形变量是最外层的组,类别变量是最内层的组。
首先为 Y,类别变量在下方
图形变量是最内层的组,类别变量是最外层的组。
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策