偏最小二乘回归中拟合值与残差的方法和公式

请选择您所选的方法或公式。

拟合值

预测的 Y 或 是使用估计回归方程的给定预测变量值的平均响应值。

交叉验证的拟合值

交叉验证的拟合值表示模型预测数据的准确程度。这些值与表示模型对数据的拟合优度的普通拟合值相似。为获得观测值的交叉验证的拟合值,必须将该观测值从用于计算模型的数据中删除,然后使用与该观测值无关的系数向量计算拟合值。交叉验证的拟合值的公式如下所示:

表示法

说明
\i表示计算模型时忽略了观测值 i
b0\i不包括观测值 i 的模型的截距
X预测变量值
B(\i)(j, k) 不包括观测值 i 的模型的系数

残差

残差是观测值与相应拟合值之间的差分。该模型不解释这部分观测值。观测值的残差为:

表示法

说明
yi观测的第 i 个响应值
i 个响应拟合值

交叉验证的残差

交叉验证的残差可度量模型的预测能力,并用于计算 PRESS 统计量。PLS 和最小二乘回归中的交叉验证的残差在概念上相似,但计算方法不同。

公式

在 PLS 中,交叉验证的残差是实际响应变量与交叉验证拟合值之间的差。

交叉验证的残差值会根据交叉验证期间每次重新计算模型时忽略的观测值数的不同而有所不同。

在最小二乘回归中,交叉验证的残差可直接根据普通残差进行计算。

表示法

说明
(i)计算模型时忽略的观测值
yi 响应值
交叉验证的拟合值

标准化残差 (Std Resid)

标准化残差也称为“内部 t 化残差”。

公式

表示法

说明
ei i 个残差
hi X(X'X)–1X' 的第 i 个对角线元素
s2 均方误
X设计矩阵
X'转置设计矩阵

拟合值的标准误(拟合值 SE)

具有一个预测变量的回归模型中拟合值的标准误为:

具有多个预测变量的回归模型中拟合值的标准误为:

表示法

说明
s2均方误
n观测值个数
x0新的预测变量值
预测变量均值
xi第 i 个预测变量值
x0生成拟合值的值向量,在设计矩阵中,每列一个,以常量项的 1 开始
x'0新的预测变量值向量的转置
X设计矩阵

置信区间

置信区间是一组给定预测变量值的估计均值响应将落入的极差。该区间由下限和上限共同定义,它们可由拟合值的置信水平和标准误计算得出。

公式

表示法

说明
α Alpha 值
n 观测值数
p 预测变量数
s 2 均方误
S 2(b)系数的方差-协方差矩阵

预测区间

预测区间是新观测值的拟合响应预计将落入的范围。

公式

表示法

说明
s(预测)
一组给定预测变量值的拟合响应值
α 显著性水平
n 观测值个数
p 模型参数个数
s 2 均方误
X 预测变量矩阵
X0 给定预测变量值的矩阵
X'0转置新的预测变量值向量
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策