Minitab 使用由 Herman Wold1发明的非线性迭代偏最小二乘 (NIPALS) 算法来解决与病态数据相关的问题。PLS 通过减去基于预测变量和响应变量之间的协方差的不相关分量,减少预测变量数。PLS 类似于主成分回归和脊回归,但计算方法各不相同。
PLS 算法可以生成一系列模型,其中,每个连续模型包含一个附加分量。一次计算一个分量,从标准化 X 和 Y 矩阵开始。后续分量是根据 X 和 Y 矩阵计算的;迭代会在达到最大分量数后或在 X 残差变为零矩阵时停止。如果分量数等于预测变量数,则 PLS 模型等于最小二乘回归模型。交叉验证用于标识分量数,以最小化预测误差。
PLS 可同时对预测变量和响应变量执行分解。在 Minitab 确定分量数和计算载荷后,它会计算每个预测变量的回归系数。对于 PLS 和 NIPALS 的更多详细信息,请参见 234。
计算潜在模型的预测能力,以帮助您确定要保留在模型中的适当的分量数。当数据包含多个响应变量时,Minitab 同时验证所有响应变量的分量。
对于每个潜在模型,Minitab 将进行以下操作:
对每个模型执行步骤 1-5 后,Minitab 将选择具有可以产生最高的预测 R2 和最低的 PRESS 的分量数的模型。具有多重响应变量时,Minitab 将选择具有最高平均预测 R2 和最低平均 PRESS 的模型。