使用 TreeNet® 回归拟合模型发现关键预测变量 的超参数优化

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

使用结果来比较模型在超参数的不同设置下的表现。单击 调整超参数以确定更好的模型 以评估超参数的其他值。

最优树数

每一步的最优树数通常不同。当最优数量接近于用于分析的最大树数时,如果增加树数,模型比最优树数远低于最大树数的模型更容易改进。您可以考虑是否进一步探索一种似乎有可能改进的备择模型。

R 平方 (%)

R2 是由模型解释的响应的变异百分比。异常值对 R2 的影响比对 MAD 的影响大。

当您使用平方误差损失函数或 Huber 损失函数时,该表格包括每个模型的 R2 值。接下来的结果适用于具有最高 R2 值的模型。

平均绝对误差 (MAD)

平均绝对偏差 (MAD) 是预测值与实际值之间差值的绝对值的平均值。MAD 越小,模型拟合数据的优度越高。MAD 以与数据相同的单位表示准确度,从而有助于使误差量概念化。异常值对 MAD 的影响小于对 R2 的影响。

当您使用绝对偏差损失函数时,该表格包括每个模型的 MAD 值。表格后面的完整结果适用于 MAD 值最小的模型。

学习速率

学习速率越低,为模型中的每个新树赋予的权重就越低,有时为模型生成的树也越多。模型的学习速率越低,训练数据集的过度拟合几率就越低。学习速率低的模型通常使用更多的树来查找最优树数。

子样本部分

子样本部分是分析用于构建每个树的数据比率。

每个树的最大终端节点数

TreeNet® 回归 将许多小的 CART® 树组合到一个功能强大的模型中。您可以为这些较小的 CART® 树指定最大终端节点数或最大树深度。具有更多终端节点的树可以对更复杂的交互作用建模。一般来说,高于 12 的值可能会减慢分析速度,而对模型没有太大好处。

最大树深度

TreeNet® 回归 将许多小的 CART® 树组合到一个功能强大的模型中。您可以为这些较小的 CART® 树指定最大终端节点数或最大树深度。更深的树可以对更复杂的交互作用建模。从 4 到 6 的值足以用于许多数据集。