选择超参数值从结果中进行评估 TreeNet^® 回归

运行预测分析模块 > TreeNet® 回归 > 拟合模型。单击在结果中调整超参数按钮。

运行预测分析模块 > TreeNet® 回归 > 发现关键预测变量。单击在结果中调整超参数按钮。

运行预测分析模块 > 自动化机器学习 > 发现最佳模型 (连续响应)。在结果中选择备择模型单击。

概述

TreeNet^® 模型的性能通常对学习速率、子样本部分和构成模型的单个树的复杂度等值敏感。在模型的结果中，单击调整超参数来评估这些超参数的多个值，以了解哪个组合产生准确度标准的最佳值，例如最大 R² 值。这些超参数的更好值有可能显著提高预测准确度，因此探索不同的值是分析中常见的一步。

你还可以调整节点拆分的预测变量数量以及模型中包含的树数。通常，当你考虑每个节点的所有预测变量时，分析效果会很好。但是，当分析考虑在每个节点上使用预测变量的不同随机子集时，某些数据集的预测变量之间具有关联，这会使模型性能有所改进。

一般来说，300 个树足以区分超参数值。通常，当一个或多个关注模型的最优树数接近最大树数时，您会增加树数。如果树数接近最大数，则增加树数更有可能提高模型的性能。

为每个超参数指定一个或多个值以进行评估。分析评估了超参数，以找到具有准确度标准最佳值的组合。如果您没有为超参数输入任何值，则评估将在结果中使用模型中该超参数的值。如果响应是二值响应，并且原始模型指定了要采样的事件和非事件的比率，则评估始终使用原始模型中的比率。

输入最多 10 个值。合格值范围为 0.0001 到 1。除非您选择评估完整的参数组合，否则对学习速率的评估是第一位的。如果先进行评估，则学习速率的评估使用学习速率和子样本部分的最小值。

输入最多 10 个值。合格值大于 0 且小于或等于 1。除非您选择评估完整的参数组合，否则子样本的评估是第二位的。如果评估发生在第二位，则子样本部分的评估就使用分析中发现的学习速率的最佳值和子样本部分的最小值。

当原始模型指定要为二值响应而采样的事件和非事件的比率时，子样本部分被禁用。

选择是评估最大终端节点数还是最大树深度。通常，任一选择都是识别有用模型的合理方法，选择仅取决于个人偏好。除非您选择评估完整的参数组合，否则对复杂度参数的评估将在最后进行。如果评估发生在最后，则评估会使用通过分析已经发现的学习速率和子样本部分的最佳值。

最大终端节点数: 输入最多 3 个值。合格值范围为 2 到 2000。通常，默认值 6 在计算速度与变量间交互作用调查之间提供了良好的平衡。值 2 排除了交互作用调查。
最大树深度: 输入最多 3 个值。合格值范围在 2 到 1000 之间，以表示树的最大深度。根节点对应于深度 1。在许多应用中，从 4 到 6 的深度提供良好的模型

输入最多 3 个值。符合条件的值介于 1 和预测变量总数之间。通常，当您考虑预测变量的总数时，分析效果很好。但是，当分析考虑每个节点的较少数量的预测变量时，某些数据集在预测变量之间具有关联，从而提高模型性能。

输入介于 1 和 5000 之间的值，以设置要构建的最大树数。300 这个默认值通常为评估超参数值提供有用的结果。

如果一个或多个关注模型的树数接近您指定的树数，则考虑是否增加树数。如果树数接近最大数，则增加树数更有可能提高模型的性能。

如果您指定多个超参数的值，则评估表中的模型取决于您是否评估了超参数的完整组合。

指定要检查的值后，单击显示结果。在一组新的结果中，Minitab 生成了一张表格，该表格比较超参数组合的准确度标准与具有准确度标准最佳值的模型的结果。

Minitab 为新模型重新创建与原始模型相同的表格和图形。新模型的表格和图形在一组新结果中。存储与原始分析相同。存储列位于同一个工作表中。例如，如果原始分析将拟合值存储在标题为“拟合值”的列中，则新分析将空白列标题命名为“Fit_1”并存储拟合值。