逐步删除项并将其添加到模型中,以便识别有用的项子集。如果选择逐步过程,则在模型对话框中指定的项是最终模型的候选项。有关详细信息,请转到使用逐步回归和最佳子集回归。
通过交叉验证,该过程在每个折叠上重复前进法。该过程评估每个步骤中的所有折叠,并标识具有最佳 K 折叠逐步 R2 值的步骤。该过程的最后一部分是对完整数据集执行前进法,在折叠上选择的最佳步骤处停止。
对于这两种验证类型,该过程在遇到与前进法标准过程相同的停止情况时停止。
最终模型中包含的项取决于模型的层次结构限制。有关详细信息,请参阅下面的层次结构主题。
Specify which information criterion to use in forward selection.
AICc 和 BIC 评估模型的似然,然后将用来添加项的惩罚应用于模型。惩罚会降低趋势,以使模型过度拟合样本数据。趋势降低可能会生成性能通常更佳的模型。
一般准则是,当参数个数相对于样本数量较小时,BIC 对于添加每个参数所施加的惩罚比 AICc 大。在这些情况下,最小化 BIC 的模型往往比最小化 AICc 的模型小。
在一些常见情况(如筛选设计)下,参数个数相对于样本数量通常较大。在这些情况下,最小化 AICc 的模型往往比最小化 BIC 的模型小。例如,对于包含 13 个游程的明确筛选设计,在一组包含 6 个或多个参数的模型中,最小化 AICc 的模型往往比最小化 BIC 的模型小。
有关 AICc 和 BIC 的更多信息,请参见 Burnham 和 Anderson。1
验证设置也位于 验证方式 子对话框中。如果更改设置,Minitab 会自动更新这两个位置的设置。
选择 前进法并验证 时,选择用于检验模型的验证方法。通常,对于较小的样本,K 折叠交叉验证方法比较合适。对于较大的样本,可以将数据分为训练数据集和检验数据集。
完成以下步骤以使用 K 折叠交叉验证。
完成以下步骤,将数据分为训练数据集和检验数据集。
您可以确定 Minitab 如何在使用逐步法时强制执行模型层次结构。如果在模型对话框中指定非分层模型,将禁用层次结构按钮。
在分层模型中,组成高阶项的所有低阶项也将显示在模型中。例如,包含交互作用项 A*B*C 的模型为分层结构,但前提是该模型包括 A、B、C、A*B、A*C 和 B*C 项。
模型可能是非分层结构。通常情况下,如果低阶项不显著,您可以将其删除,除非专业领域知识建议您将其包含在模型中。包含过多项的模型的精确度相对较差,可能会降低预测新观测值的能力。
选择前进法并验证时,将为前进法的每个步骤显示训练和验证偏差 R2 值的图。通常,该图将用来确定简化模型是否具有相似的验证值。