残差的直方图显示所有观测值的残差分布。
模式 | 模式的含义 |
---|---|
朝着一个方向的长尾 | 偏度 |
远离其他条形的条形 | 异常值 |
因为直方图的外观取决于用来进行数据分组的区间数,所以请勿使用直方图评估残差的正态性。
具有大约 20 个或更多个数据点时,直方图效果最明显。如果样本过小,则直方图的每个条形都未包含可靠显示偏斜或异常值的足够数据点。
残差与拟合值图形分别在 y 轴和 x 轴上绘制残差和拟合值。
使用残差与拟合值图可验证残差随机分布且具有常量方差的假设。理想情况下,点应当在 0 的两端随机分布,点中无可辨识的模式。
模式 | 模式的含义 |
---|---|
残差相对拟合值呈扇形或不均匀分散 | 异方差 |
曲线 | 缺少高阶项 |
远离 0 的点 | 异常值 |
在 X 方向远离其他点的点 | 有影响的点 |
其中一个点比所有其他点大得多。因此,该点是异常值。如果异常值过多,则模型可能不可接受。您应该尝试找出导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。
残差的方差随拟合值增加。请注意,随着拟合值增大,残差之间的散布变宽。此模式表示残差的方差不相等(非恒定)。
残差与顺序图按照数据的收集顺序显示残差。
残差与变量的关系图显示残差与另一个变量的关系。 已在模型中包含此变量。 或者,模型中未包含此变量,但是猜测它会影响响应变量。
如果变量已经包括在模型中,则请使用此图确定是否应该添加该变量的高次项。 如果变量尚未包含在模型中,则请使用此图确定变量是否系统地影响响应。
模式 | 模式的含义 |
---|---|
残差的排列有模式 | 变量系统地影响响应。如果该变量不在模型中,请为该变量添加一个项并重新拟合模型。 |
点的排列有弯曲 | 应该在模型中包括变量的高次项。例如,曲线图形趋势表明应该添加平方项。 |