R 平方与模型选择步骤

当您使用前进法并验证 作为逐步过程时,Minitab 会为训练数据集提供 R2 统计量图,并为模型选择过程中的每个步骤提供检验 R2 统计量或 k 折叠逐步 R2 统计量。检验 R2 统计量或 k 折叠逐步 R2 统计量的显示取决于您是使用检验数据集还是 k 折叠交叉验证。

解释

使用此图比较每个步骤中不同 R2 统计量的值。通常,当 R2 统计量均较大时,模型执行情况良好。Minitab 显示来自步骤的模型回归统计量,该步骤最大化检验 R2 统计量或 k 折叠逐步 R2 统计量。此图显示任何更简单的模型是否拟合度足够,可成为理想候选。

如果模型过度拟合,检验 R2 统计量或 k 折叠逐步 R2 统计量开始随着项进入模型而减少。当所有数据的相应训练 R2 统计量或 R2 统计量继续增加时,就会发生此减少情况。当您为在总体中不重要的效应添加项时,将出现过度拟合模型。过度拟合模型对于预测总体可能没有帮助。如果模型过度拟合,则可以考虑早期步骤的模型。

下图以检验 R2 为例。最初,R2 统计量都接近 70%。对于前几个步骤,R2 统计量都趋向于随着项输入模型而增加。在步骤 6 中,检验 R2 统计量约为 88%。检验 R2 统计量的最大值位于步骤 14 中,其值接近 90%。您可以考虑拟合的改进是否证明向模型中添加更多项会增加复杂度。

步骤 14 之后,当 R2 继续增加时,检验 R2 不会增加。步骤 14 之后,检验 R2 的减少表明模型过度拟合。