指定 发现最佳模型 (连续响应) 的模型项

预测分析模块 > 自动化机器学习 > 发现最佳模型 (连续响应) >
注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

指定如何确定回归模型中的术语。通常,结合步进模型选择,考虑线性术语和顺序 2 的分析提供了具有良好预测能力的模型。您可以选择 前进法并验证 确定该方法是否生成具有更高预测精度的模型。

如果您有大量的预测器,最终模型的选择可能需要很长时间来考虑线性条款和顺序 2 与步进模型选择。如果预测器的数量大于 15,则默认选择仅考虑线性术语。要评估除线性术语之外的一些更高阶术语,请选择指定模型中的术语。

要包括在回归模型中的项

选择是使用默认条款还是指定您自己的一组术语。

线性项和二阶项
分析使用所有线性术语和顺序 2。顺序 2 包括 2 个线性术语和连续预测器的方形术语之间的所有相互作用。
线性项
分析使用所有线性术语。
指定项
您可以向模型添加交互作用项和多项式项。请仅使用在主对话框中输入的因子和协变量来构建模型。如果预测器的数量为 15 或更少,则该模型包含预测器的线性术语和顺序 2。如果预测器的数量大于 15,则模型包含线性术语。单击 默认 以返回到上一决策。
可以使用多种方法划分数据子集:我们使用示例来进行解释。对于示例,假设 预测变量 列表具有 3 个连续变量 X、Y、Z 和 2 个类别变量 A、B。
使用选定预测变量和模型项添加项
要向模型添加项,请选择至少一个预测变量或项。要选择多个项或取消选择一个项,请在单击预测变量或项的同时,按 Ctrl 键。
按变量顺序添加交互项
通过指定的顺序添加所有交互作用项。假设您选择预测器 X、Y、A 并通过订单 3 添加交互。单击时 添加,Minitab 会添加 X*Y、X*A、Y*A、X*Y*A。
按阶数添加全部交互项
用于建模弯曲。此选项通过指定的顺序添加幂和交互作用项。幂用于连续预测变量。假设您通过订单 3 选择 X、Y、A 和术语。单击时 添加,Minitab 会添加 X 和 Y 的电源术语:X*X,Y*Y,X*X*X,Y*Y*Y。Minitab 还添加了预测变量和电源的交互:X*Y、X*A、Y*A、X*X*Y、X*Y*Y、X*X*A、X*Y*A、Y*Y*A。
模型中的交叉预测变量和项
此选项可通过以下方式使用:
  • 你可以交叉两个或更多预测变量。假设您选择 X、Y、Z。单击时 添加,Minitab 会添加以下术语:X*X,X*Y,X*Z。
  • 您可以将已存在于模型中的项进行交叉。假设 X*A 和 X*B 已经存在于模型中。如果仅选择这些项并单击 添加,则 Minitab 会添加 X*X*A*B。
  • 您可以在模型中将预测变量与项相交叉。假设 X*X 和 Y*Y 已存在于模型中。如果您选择了这些项和预测变量 A、B,然后单击 添加,Minitab 会添加 X*X*A、X*X*B、Y*Y*A、Y*Y*B。每个预测器都与每个模型术语交叉。类别预测变量不能与自己进行交叉。模型术语不会与自己交叉。
注意

您可能需要取消选择预测变量或项,这样就会只选择您希望交叉的项。要取消选择项,请在单击预测变量或项的同时,按 Ctrl 键。

模型中的项
当您向模型添加项时,这些项会列在对话框的空白处。在此空白处,您可以选择单个项或几组项来进行删除或重新排序。
默认
如果预测器的数量为 15 或更少,此选择会用线性术语和顺序 2 填充模型。如果预测器的数量超过 15,此选择会用线性术语填充模型。
删除项
您可以从模型中删除一个或多个项。选择项并在对话框中单击“删除”(红色的“X”)。您还可以双击某个项来进行删除。
重新排序项
要移动项,请选择项,然后单击对话框中一个箭头按钮来向上或向下移动项。您还可以移动连续项区组。单击第一个项,然后按住 Shift 键,再单击最后一个项以便选择整个区组。然后单击相应的箭头来移动区组。

回归模型选择法

指定是否使用非分层模型Minitab 呈现的选择取决于数据集的大小。选择与子对话中的选择相结合 验证 ,提供平衡严谨性和计算速度的分析:

N < 1,500
子对话的验证方法 验证K 折叠交叉验证。单位数是 5。 子对话框中的 回归模型选择法逐步
1,500 ≤ N < 2,000
子对话的验证方法 验证K 折叠交叉验证。单位数是 5。 子对话框中的 回归模型选择法前进法并验证
2,000 ≤ N
子对话的验证方法 验证使用测试集验证。测试集中的数据比例为 0.3。 子对话框中的 回归模型选择法前进法并验证
  • 逐步:此方法从空模型开始。然后,Minitab 为每个步骤添加或删除项。当不在模型中的所有变量的 p 值都大于指定的值,且模型中所有变量的 p 值都小于或等于指定的值时,Minitab 停止。
  • 前进法并验证:选择 前进法并验证 时,选择用于检验模型的验证方法。通常,对于较小的样本,K 折叠交叉验证方法比较合适。对于较大的样本,可以将数据分为训练数据集和检验数据集。该过程类似于前进法。在每个步骤结束时,Minitab 计算检验 R2 统计量。在前进法过程结束时,具有最大检验 R2 值的模型为最终模型。
    该过程将添加项,直到出现以下情况之一:
    • 该过程在连续 8 个步骤中没有发现标准改进。
    • 该过程拟合全模型。
    • 该过程拟合误差自由度为 1 的的模型。
  • ::采用您在中指定的所有项来拟合模型。