拟合值与残差(适用于偏最小二乘回归

请查找定义和解释指导,了解拟合值与残差表中的每个统计量。

拟合值

拟合值又称拟合或 。拟合值是对于给定预测变量值的均值响应的点估计。这些预测变量值又称 X 值。

解释

拟合值是通过将数据集内每个观测值的特定 x 值输入到模型方程中来计算的。

例如,如果方程为 y = 5 + 10x,则 x 值 2 的拟合值为 25 (25 = 5 + 10(2))。

残差 (Res)

残差 (ei) 是观测值 (y) 与相应拟合值之间的差分 (),该差分是由模型预测的值。

此散点图显示成年男性样本的体重与身高。拟合回归线表示身高与体重之间的关系。如果身高等于 6 英尺,则体重的拟合值为 190 磅。如果实际体重为 200 磅,则残差为 10。

解释

标绘残差以确定您的模型是否适用,是否满足回归假设。检查残差可以提供有关模型对数据的拟合优度的有用信息。一般而言,残差应当是随机分布的,而且没有明显的模式和异常值。

标准化残差 (SRes)

标准化残差等于残差值 (ei) 除以其标准差的估计值。

解释

使用标准化残差帮助您检测异常值。

标准化残差很有用,因为原始残差可能不是良好的异常值指示符。每个原始残差的变异因与其关联的 X 值而异。尺度不同会使得很难评估原始残差的大小。标准化残差可以通过将不同的变异转换为公共尺度来解决此问题。

交叉验证的拟合值

在 PLS 回归中,交叉验证的拟合值是数据集中的每个观测值的预测响应,它是单独计算的,所以该观测值可以从用于计算其预测响应的模型中剔除。交叉验证的拟合值是在交叉验证期间计算的,根据每次重新计算模型时忽略的观测值数的不同而有所不同。

使用交叉验证的拟合值标识模型对数据的预测优度。交叉验证的拟合值与普通的拟合值相似,后者表示模型对数据的拟合优度。

交叉验证的残差

在 PLS 回归中,交叉验证的残差是实际响应变量与交叉验证拟合值之间的差。交叉验证的残差值会根据交叉验证期间每次重新计算模型时忽略的观测值数的不同而有所不同。

残差可度量模型的预测能力。Minitab 使用交叉验证的残差计算 PRESS 统计量。