交叉验证用于计算潜在模型的预测能力,以帮助您确定要保留在模型中的相应分量数。如果不知道最优的分量数,最好使用交叉验证。当数据包含多个响应变量时,Minitab 同时验证所有响应变量的分量。
对每个模型执行步骤 1-5 后,Minitab 将选择具有可以产生最高的预测 R2 和最低的 PRESS 的分量数的模型。具有多重响应变量时,Minitab 将选择具有最高平均预测 R2 和最低平均 PRESS 的模型。
如果不使用交叉验证,Minitab 会将分量数设置为 10 或模型中的预测变量数两者中较小的那个值。
在 PLS 回归中,交叉验证的拟合值是数据集中的每个观测值的预测响应,它是单独计算的,所以该观测值可以从用于计算其预测响应的模型中剔除。交叉验证的拟合值是在交叉验证期间计算的,根据每次重新计算模型时忽略的观测值数的不同而有所不同。
使用交叉验证的拟合值标识模型对数据的预测优度。交叉验证的拟合值与普通的拟合值相似,后者表示模型对数据的拟合优度。
在 PLS 回归中,交叉验证的残差是实际响应变量与交叉验证拟合值之间的差。交叉验证的残差值会根据交叉验证期间每次重新计算模型时忽略的观测值数的不同而有所不同。
残差可度量模型的预测能力。Minitab 使用交叉验证的残差计算 PRESS 统计量。