偏最小二乘回归的方法

请选择您所选的方法。

模型拟合

Minitab 使用由 Herman Wold1发明的非线性迭代偏最小二乘 (NIPALS) 算法来解决与病态数据相关的问题。PLS 通过减去基于预测变量和响应变量之间的协方差的不相关分量,减少预测变量数。PLS 类似于主成分回归和脊回归,但计算方法各不相同。

PLS 算法可以生成一系列模型,其中,每个连续模型包含一个附加分量。一次计算一个分量,从标准化 X 和 Y 矩阵开始。后续分量是根据 X 和 Y 矩阵计算的;迭代会在达到最大分量数后或在 X 残差变为零矩阵时停止。如果分量数等于预测变量数,则 PLS 模型等于最小二乘回归模型。交叉验证用于标识分量数,以最小化预测误差。

PLS 可同时对预测变量和响应变量执行分解。在 Minitab 确定分量数和计算载荷后,它会计算每个预测变量的回归系数。对于 PLS 和 NIPALS 的更多详细信息,请参见 234

交叉验证

计算潜在模型的预测能力,以帮助您确定要保留在模型中的适当的分量数。当数据包含多个响应变量时,Minitab 同时验证所有响应变量的分量。

交叉验证过程

对于每个潜在模型,Minitab 将进行以下操作:

  1. 根据您使用的交叉验证方法,忽略一个观测值或一组观测值。
  2. 不考虑该观测值/观测值组的情况下,重新计算模型。
  3. 使用重新计算的模型预测忽略的观测值/观测值组的响应或交叉验证的拟合值,并计算交叉验证残差值。
  4. 重复步骤 1-3,直到忽略并拟合了所有的观测值。
  5. 计算预测平方和 (PRESS) 和预测的 R2 值。

对每个模型执行步骤 1-5 后,Minitab 将选择具有可以产生最高的预测 R2 和最低的 PRESS 的分量数的模型。具有多重响应变量时,Minitab 将选择具有最高平均预测 R2 和最低平均 PRESS 的模型。

1 H. Wold (1975)。“Soft Modeling by Latent Variables; the Nonlinear Iterative Partial Least Squares Approach”(潜变量的软建模;非线性迭代偏最小二乘法),Perspectives in Probability and Statistics, Papers in Honour of M.S. Bartlett(纪念 M.S. Bartlett 的文章概率和统计量中的观点),ed. J. Gani, Academic Press。
2 P. Geladi 和 B. Kowalski (1986)。“Partial Least-Squares Regression: A Tutorial”(偏最小二乘回归:教程),Analytica Chimica Acta(分析化学学报),185,1-17。
3 A. Hoskuldsson (1988)。“PLS Regression Methods”(PLS 回归方法),Journal of Chemometrics(化学计量学杂志),2,211-228。
4 A. Lorber、L. Wangen 和 B. Kowalski (1987)。“A Theoretical Foundation for the PLS Algorithm”(PLS 算法的理论基础),Journal of Chemometrics(化学计量学杂志),1,19-31。