解释区间散点图的主要结果

请完成以下步骤来解释区间散点图。

步骤 1:在数据中查找模式

确定哪个模型关系能够以最佳方式拟合数据并评估模型关系的强度。

关系的类型

尽管无法为区间散点图添加回归拟合线,但仍可以在数据中查找以下模式。如果看到模式,可以使用统计 > 回归 > 回归 > 拟合回归模型来创建模型。
线性:正
线性:负
曲线:二次
曲线:立方
无关系

在此示例中,Minitab 按矩形区间组合数据。Minitab 根据区间中的观测值数量,针对区间使用浅灰色到深蓝色。该经济学家注意到,许多人的债务比率接近 0(与年龄无关),只有极少人的债务比率接近 1。图中央较深的区域显示,债务比率随着年龄增大而提高。 然而,当年龄在50左右时,较暗的区域会向下弯曲,并开始随着年龄的增长而减少。 年龄和债务比率似乎有二次关系。该经济学家认为,债务比率的回归模型应包括年龄的二阶项。

步骤 2:查找具有第三个变量的模式

如果要使用第三个变量,请查找该变量与 x 和 y 变量之间的关系。Minitab 根据区间中所有观测值的第三个变量的平均值对区间进行着色。如果不存在关系,则区间散点图中区间的颜色将随机分散。颜色模式表示可能存在关系。

在此示例中,研究团队希望确定克拉和颜色如何影响钻石价格。 Minitab 根据钻石的颜色对区间使用深蓝色到深红色。红色系越深,对应的颜色变量值越大。蓝色系越深,对应的颜色变量值越小。克拉数越大,价格越高。不过,对于克拉数相同的钻石,价格仍有很大差异。钻石的颜色说明了其中的一些变化。对于克拉数相似的钻石,颜色编号越大,价格越高。

注意

钻石的颜色用字母表示。 由于所有变量都必须为数字,因此研究人员将钻石的颜色编码为 0-6 之间的数字刻度。 企业主为无色钻石赋予较高的数值,为浅黄色钻石赋予较低的数值。

步骤 3:查找异常值

异常值是远离其他数据值的数据值,可能表示数据中存在异常情况,且可能会显著影响结果。

在区间散点图中,可以使用独立区间标识异常值。

尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。