发现最佳模型 (二值响应) 选择替代模型

运行 预测分析模块 > 自动化机器学习 > 发现最佳模型 (二值响应)。 在结果中 选择备择模型 单击。
注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

概述

当您使用 发现最佳模型 (二值响应) 删除最不重要的预测变量时,Minitab Statistical Software 会为具有分析准确度标准最佳值的模型生成结果,例如最小负对数似然平均值。Minitab 允许您探索其他型号和其他类型的模型的结果。例如,如果另一种类型的模型产生类似的预测精度,您可以确定同一类型的模型是否重要。

项目 ID 依应用程序的类型而定。对于 CART® 和二进制物流回归模型,您可以从搜索中查看最佳模型的结果。对 Random Forests® 和 TreeNet® 模型,您可以检查搜索中任何模型的结果。对 Random Forests® 和 TreeNet® 模型,您也可以调整超参数,以寻找比搜索中的超参数产生更好值的组合。

Random Forests® 分类

选择现有模型,为搜索中的某个模型生成结果。指定超参数以适应新型号,以寻找提高模型性能的超参数组合。

选择现有模型

在搜索最佳型号时,分析可生成多达 3 个随机森林® 型号,内部节点具有不同的最小尺寸。从列表中选择一个模型,然后单击 显示结果 以生成该模型的结果。

指定用来拟合新模型的超参数

分析要求您指定前 3 个超参数。指定小于训练数据大小的 bootstrap 样本数单击 显示结果 以评估新型号的超参数。结果包括一个表,比较不同组合的超参数的最佳度标准和模型的模型结果与最佳标准的最佳值,如最低平均 -日志。
节点分裂的预测变量数
指定每次节点分裂要考虑的预测变量数。通常,考虑使用预测变量总数的平方根时,分析效果良好。但是,当分析考虑将较大或较小的预测变量数用于每个节点时,某些数据集在预测变量之间具有关联,从而改进模型性能。
用于拆分内部节点的最小案例数
输入节点可以拥有且仍可分裂为更多节点的最小案例数。默认情况下,原始搜索包括数字 2、5 和 8。
要使树增长的 Bootstrap 样本数
输入用于确定 bootstrap 样本数和分析生成的树数量的值。输入介于 3 到 3000 之间的值。
指定小于训练数据大小的 bootstrap 样本数
选择此选项可输入用于设置 bootstrap 样本数的值。必须输入大于或等于 5 的值。如果输入的数量值大于训练数据大小,Minitab 将使用等于训练数据大小的样本数量值。

树网®

选择现有模型,为搜索中的某个模型生成结果。指定超参数以适应新型号,以寻找提高模型性能的超参数组合。

选择现有模型

在搜索最佳型号时,分析为每种超参数组合生成 TreeNet® 模型。从列表中选择一个模型,然后单击 显示结果 以生成该模型的结果。

指定用来拟合新模型的超参数

分析要求您指定所有超参数。单击 显示结果 以评估新型号的超参数。结果包括一个表,比较不同组合的超参数的最佳度标准,以及模型的结果与分析精度标准的最佳值,如最小平均 [日志状' 。

学习速率
输入最多 10 个值。合格值范围为 0.0001 到 1。
子样本部分
输入最多 10 个值。合格值大于 0 且小于或等于 1。
每个树的最大终端节点数最大树深度
选择是评估 每个树的最大终端节点数 还是 最大树深度。通常,任一选择都是识别有用模型的合理方法,选择仅取决于个人偏好。
最大终端节点数
输入最多 3 个值。合格值范围为 2 到 2000。值 2 排除了交互作用调查。
最大树深度
输入最多 3 个值。合格值范围在 2 到 1000 之间,以表示树的最大深度。根节点对应于深度 1。在许多应用中,从 4 到 6 的深度提供良好的模型
节点分裂的预测变量数
输入最多 3 个值。合格值在 1 和预测器总数之间。通常,考虑使用预测变量总数的平方根时,分析效果良好。但是,当分析考虑将较大或较小的预测变量数用于每个节点时,某些数据集在预测变量之间具有关联,从而改进模型性能。
树数
输入介于 1 和 5000 之间的值,以指定要构建的最大树数。300 这个默认值通常为评估超参数值提供有用的结果。
如果一个或多个关注模型的树数接近您指定的树数,则考虑是否增加树数。如果树数接近最大数,则增加树数更有可能提高模型的性能。

Logistic 回归

选择 Logistic 回归模型的结果 并单击 显示结果 以通过搜索最佳模型类型生成最佳二元逻辑回归模型的结果。

CART®

CART® 模型的结果 搜索最佳型号中选择并单击 显示结果 以生成最佳 CART® 模型的结果。