异常观测值(也常称为强影响点的观测值)是对回归或方差分析模型的影响不成比例的观测值。识别出异常观测值非常重要,因为它们可能会产生误导性结果。例如,一个异常观测值可能会导致显著的系数看上去并不显著。
Minitab 标记的观测值未能很好地遵循建议的回归方程。但是,预计您将得到一些异常观测值。例如,基于较大残差的标准,预计大约 5% 的观测值将标记为具有较大的残差。
在前面的输出中,观测值 1 以 X 表示,并将其识别为杠杆率点。观测值 22 以 R 表示,为异常值。
要确定一个异常观测值的影响程度如何,请分别采用或不采用观测值来拟合模型并比较系数、p 值、R2 和其他模型参数。如果排除异常观测值后模型有显著变化,首先确定该观测值是否是数据输入或测量错误。如果不是,则进一步检查模型以确定是否忽略了重要项(例如,交互作用项)或变量,或者指定了错误的模型。您可能需要收集更多数据才能找到最终答案。