Minitab 中包含哪些类型的残差?

Minitab 计算 3 种类型的残差。

常规残差

残差是观测值 (y) 与其相应拟合值 ()。

例如,此散点图对照人的身高绘制人的体重。拟合回归线针对每个身高观测值绘制体重拟合值。假设一个人身高 6 英尺,其体重的拟合值为 190 磅。如果此人的实际体重为 200,则残差为 10。

绘制残差并使用其他诊断统计量,以确定模型是否适用以及是否满足回归假设。残差还可以确定某个模型对观测数据变异的解释程度。

标准化残差

标准化残差等于残差值 ei 除以其标准差的估计值。通常将大于 2 和小于 -2 的标准化残差视为较大,Minitab 在异常观测值表以及拟合值与残差表中以“R”标记这些观测值。Minitab 标记的观测值未能很好地遵循建议的回归方程。但是,预计您将得到一些异常观测值。例如,基于较大标准化残差的标准,因为具有较大的标准化残差,预计将标记约 5% 的观测值。

使用标准化残差帮助您检测异常值。标准化残差非常有用,因为原始残差在存在异方差时可能不是可接受的异常值标识符。如果 x 值远离 的残差的方差大于 x 值接近 的残差,则异常值难以检测。将此非恒定方差的对照物标准化,所有标准化残差就具有相同的标准差。

标准化残差也称为内部 t 化残差。

t 化删后残差

计算观测值的 t 化删后残差的方法是将观测值的删后残差除以其标准差的估计值。删后残差 di 是 yi 与其在模型中的拟合值之差,该拟合值在计算中删除了第 i 个观测值。删除观测值是为了确定没有此潜在异常值时模型的行为。如果观测值的 t 化删后残差较大(如果其绝对值大于 2),则它可能是数据中的异常值。

使用删后残差可帮助您检测异常值。删后残差非常有用,因为在存在异方差时用原始残差来判断异常值可能不是可接受的。如果 x 值远离 的残差的方差大于 x 值接近 的残差,则异常值难以检测。所有删后残差都有相同的标准差。

每个 t 化删后残差都服从具有 (n – 1 – p) 个自由度的 t 分布,其中 p 等于回归模型中的项数。

t 化删后残差也称为外部 t 化残差或删后 t 残差。