为 选择替代型号 发现最佳模型 (连续响应)

运行 预测分析模块 > 自动化机器学习 > 发现最佳模型 (连续响应)。 在结果中 选择备择模型 单击。
注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

当您用于 发现最佳模型 (连续响应) 标识最佳模型类型时,Minitab 统计软件会为具有分析精度标准的最佳值(例如最大 R2)的模型生成结果。Minitab 允许您浏览其他模型和其他类型的模型的结果。例如,如果其他类型的模型产生类似的预测精度,则可以确定相同的预测变量在每种类型的模型中是否重要。

可用选项取决于模型的类型。对于多元回归和 CART® 模型,您可以从搜索中检查最佳模型的结果。对于随机Random Forests®、TreeNet®和 MARS® 模型,可以检查搜索中任何模型的结果。对于随机Random Forests®、TreeNet® 和 MARS® 模型,还可以调整超参数以查找生成比搜索中的超参数更好的值的组合。

Random Forests®

选择现有模型以从搜索中生成其中一个模型的结果。指定超参数以拟合新模型,以查找可提高模型性能的超参数组合。

选择现有模型

在搜索最佳模型类型时,分析会为内部节点生成最多 3 个具有不同最小大小的随机Random Forests® 模型。从列表中选择一个模型,然后单击以 显示结果 生成该模型的结果。

指定用来拟合新模型的超参数

分析要求您指定前 3 个超参数。包含小于训练数据大小的引导样本大小是可选的。单击以 显示结果 评估新模型的超参数。结果包括一个表,该表比较了不同超参数组合的最优性标准,以及具有最优性标准的最佳值(例如最大 R2)的模型的模型结果。
节点分裂的预测变量数
为每个节点拆分指定要考虑的 1 到 3 个预测变量数量。通常,考虑使用预测变量总数的平方根时,分析效果良好。但是,当分析考虑将较大或较小的预测变量数用于每个节点时,某些数据集在预测变量之间具有关联,从而改进模型性能。
用于拆分内部节点的最小案例数
输入 1 到 3 个最小案例数,一个节点可以具有但仍拆分为多个节点。默认情况下,原始搜索包括数字 2、5 和 8。
要使树增长的 Bootstrap 样本数
输入用于确定 bootstrap 样本数和分析生成的树数量的值。输入介于 3 到 3000 之间的值。
指定小于训练数据大小的 bootstrap 样本数
选择此选项可输入用于设置 bootstrap 样本数的值。必须输入大于或等于 5 的值。如果输入的数量值大于训练数据大小,Minitab 将使用等于训练数据大小的样本数量值。

TreeNet®

选择现有模型以从搜索中生成其中一个模型的结果。指定超参数以拟合新模型,以查找可提高模型性能的超参数组合。

选择现有模型

在寻找最佳模型类型时,分析会为每个超参数组合生成一个 TreeNet® 模型。从列表中选择一个模型,然后单击以 显示结果 生成该模型的结果。

指定用来拟合新模型的超参数

分析要求您指定所有超参数。单击以 显示结果 评估新模型的超参数。结果包括一个表,用于比较不同超参数组合的最优性标准,以及具有分析精度标准的最佳值(例如最大 R2)的模型的结果。

学习速率
输入最多 10 个值。合格值范围为 0.0001 到 1。
子样本部分
输入最多 10 个值。合格值大于 0 且小于或等于 1。
每个树的最大终端节点数最大树深度
选择是评估 每个树的最大终端节点数 还是 最大树深度。通常,任何一种选择都是识别有用模型的合理方法,因此选择仅取决于个人偏好。
最大终端节点数
输入最多 3 个值。合格值范围为 2 到 2000。值 2 排除了交互作用调查。
最大树深度
输入最多 3 个值。合格值范围在 2 到 1000 之间,以表示树的最大深度。根节点对应于深度 1。在许多应用中,从 4 到 6 的深度提供良好的模型
节点分裂的预测变量数
输入最多 3 个值。符合条件的值介于 1 和预测变量总数之间。通常,当您考虑预测变量的总数时,分析效果很好。但是,当分析考虑每个节点的较少数量的预测变量时,某些数据集在预测变量之间具有关联,从而提高模型性能。
树数
输入介于 1 和 5000 之间的值,以指定要构建的最大树数。300 这个默认值通常为评估超参数值提供有用的结果。
如果一个或多个关注模型的树数接近您指定的树数,则考虑是否增加树数。如果树数接近最大数,则增加树数更有可能提高模型的性能。

MARS®

选择现有模型以从搜索中生成其中一个模型的结果。指定超参数以拟合新模型,以查找可提高模型性能的超参数组合。

选择现有模型

在搜索最佳模型类型时,分析将生成一个 MARS® 模型,其中包含搜索中的每个基函数数。从列表中选择一个模型,然后单击以 显示结果 生成该模型的结果。

指定用来拟合新模型的超参数

单击以 显示结果 评估新模型的参数。结果包括具有最优性标准最佳值(如最大 R2)的模型的模型结果。
基函数的最大数量
大多数情况下,默认值 30 效果良好。当 30 个基函数对于数据来说似乎太小时,请考虑更大的值。例如,当您认为超过 30 个预测变量很重要时,请考虑较大的值。
如果您不确定 30 是否足够,请查看初始结果。例如,如果 R 平方值随着分析添加基函数而呈上升趋势,则较大的值更有可能改善模型的拟合。
节之间的最小观测值数
允许 MARS® 选择
分析使用样本数量和模型复杂性来自动选择一个值。在大多数情况下,自动值效果很好。
用户指定的
值为 1 表示连续数据点有资格成为基函数更改的点。值 1 允许模型预测中更改最快速。使用较大的值创建更平滑的模型,以探索更一般的关系。这种更平滑的模型有时在某些数据范围内不太准确。
允许的预测变量交互:

允许预测变量交互达到您指定的顺序。交互作用意味着预测变量的效应取决于其他预测变量的值。例如,谷物在烤箱中的干燥速度取决于烤箱中的时间,但时间的影响取决于烤箱的温度。时间和温度变量相互作用。

不允许任何交互作用 (加法模型)
不允许预测变量交互作用。在这种情况下,Minitab 使用基函数不交互的加法模型。
允许最高为阶数 2 的所有交互作用
顺序指定基函数中可以包含的不同预测变量的数量。例如,阶数为 2 表示预测变量的效应可以取决于 1 个其他预测变量的值。以下基函数是阶数 2 交互作用的示例:
  • BF1 = 最大值(0, X1 − 800)
  • BF2 = 最大值(0, X2 − 50) * BF1

多元回归

选择 多元回归模型的结果 并单击以 显示结果 从搜索最佳模型类型中生成最佳多元回归模型的结果。

CART®

选择 CART® 模型的结果 并单击以 显示结果 从搜索最佳模型类型中生成最佳 CART® 模型的结果。