Minitab 可提供 Pareto 效应图,用于直观地显示系数和方差分析表中的结果。对于模型中的项,此图形可用于比较效应的相对量值并评估其统计显著性。Minitab 在模型至少保留 1 个误差自由度时绘制 Pareto 图。
统计显著性阈值取决于显著性水平(用 α 或 alpha 表示)。除非您使用逐步选择法,否则显著性水平为“1 - 用于分析的置信水平”。有关如何更改置信水平的详细信息,请转到拟合回归模型选择和 线性回归的选项。如果您使用向后选择或逐步选择法,则显著性水平为:Minitab 从模型中删除一个称为删除用 Alpha的项。如果使用向前选择,则显著性水平为:Minitab 向模型添加一个称为入选用 Alpha的项。有关逐步方法选项的更多信息,请转到对 拟合回归模型和 线性回归执行逐步回归。
当您使用前进法并验证 作为逐步过程时,Minitab 会为训练数据集提供 R2 统计量图,并为模型选择过程中的每个步骤提供检验 R2 统计量或 k 折叠逐步 R2 统计量。检验 R2 统计量或 k 折叠逐步 R2 统计量的显示取决于您是使用检验数据集还是 k 折叠交叉验证。
使用此图比较每个步骤中不同 R2 统计量的值。通常,当 R2 统计量均较大时,模型执行情况良好。Minitab 显示来自步骤的模型回归统计量,该步骤最大化检验 R2 统计量或 k 折叠逐步 R2 统计量。此图显示任何更简单的模型是否拟合度足够,可成为理想候选。
如果模型过度拟合,检验 R2 统计量或 k 折叠逐步 R2 统计量开始随着项进入模型而减少。当所有数据的相应训练 R2 统计量或 R2 统计量继续增加时,就会发生此减少情况。当您为在总体中不重要的效应添加项时,将出现过度拟合模型。过度拟合模型对于预测总体可能没有帮助。如果模型过度拟合,则可以考虑早期步骤的模型。
下图以检验 R2 为例。最初,R2 统计量都接近 70%。对于前几个步骤,R2 统计量都趋向于随着项输入模型而增加。在步骤 6 中,检验 R2 统计量约为 88%。检验 R2 统计量的最大值位于步骤 14 中,其值接近 90%。您可以考虑拟合的改进是否证明向模型中添加更多项会增加复杂度。
步骤 14 之后,当 R2 继续增加时,检验 R2 不会增加。步骤 14 之后,检验 R2 的减少表明模型过度拟合。