验证回归和方差分析中的模型假设

在拟合模型时,回归和方差分析不会停止。您应该检查残差图以及其他诊断统计量,以确定模型是否适用以及是否满足回归假设。如果您的模型不适用,则它不能正确表示您的数据。例如:
  • 系数的标准误可能会出现偏倚,从而导致错误的 t 值和 p 值。
  • 系数可能包含错误的符号。
  • 模型可能受一个点或两个点的影响。
使用下表可以确定模型是否适用。
适用回归模型的特征 检查使用 可能解决方案
函数形式可以为任何现有曲率正确建模。

失拟检验

残差与变量图

在模型中添加高次项

变换变量

非线性回归

残差的方差恒定。

残差与拟合值图

变换变量

加权最小二乘

残差彼此独立(不相关)。

Durbin-Watson 统计量

残差与顺序图

添加新的预测变量

使用时间序列分析

添加滞后变量

残差呈正态分布。

残差的直方图

残差的正态图

残差与拟合值图

正态性检验

变换变量

检查有无异常值

没有异常观测值或异常值。

残差图

杠杆率

Cook 距离

DFITS

变换变量

删除异常的观测值

数据不是病态数据。

方差膨胀因子 (VIF)

预测变量的相关矩阵

删除预测变量

偏最小二乘回归

变换变量

Determine why a model does not meet assumptions

如果确定模型不满足先前的标准,就应该:
  1. 确定数据输入是否正确,特别是观测值是否标识为异常。
  2. 尝试确定导致这一问题的原因。您可能想要确定模型对这个问题的敏感程度。例如,如果包含异常值,运行回归分析时将此观测值排除在外,然后确定两个结果有什么区别。
  3. 考虑使用前面所列的可能解决方案之一。