使用 TreeNet® 分类拟合模型发现关键预测变量 的超参数优化

查找模型评估表格的定义和解释指南。
注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

使用结果来比较模型在超参数的不同设置下的表现。单击 调整超参数以确定更好的模型 以评估超参数的其他值。

最优树数

每一步的最优树数通常不同。当最优数量接近于用于分析的最大树数时,如果增加树数,模型比最优树数远低于最大树数的模型更容易改进。您可以考虑是否进一步探索一种似乎有可能改进的备择模型。

负对数似然平均值

负对数似然平均值是对模型准确度的一种度量。值越小,拟合越好。

当响应为二值响应时,您可以使用最大对数似然作为选择最佳模型的标准。表格后面的完整结果适用于具有最小负对数似然平均值的模型。

ROC 曲线下面积

ROC 曲线在 y 轴上绘制真阳率 (TPR),也称为功效。ROC 曲线在 x 轴上绘制假阳率 (FPR),也称为 1 类错误。ROC 曲线下面积指示模型是否为良好的分类器。

对于分类树,ROC 曲线下面积的值通常介于 0.5 到 1 之间。值越大表明分类模型越好。当模型可以完美地分隔类别时,曲线下面积为 1。当模型对类别的分隔程度不如随机分配时,曲线下面积为 0.5。

当您使用 ROC 曲线下的最大面积作为最佳模型选择的标准时,该表格包括每个模型的 ROC 曲线下的面积。表格后面的完整结果适用于具有 ROC 曲线下最大面积的模型。

误分类率

误分类率指示模型对响应值进行准确分类的频率。值越小表明模型性能越好。

当您使用最小误分类率作为最佳模型选择的标准时,该表格包括每个模型的误分类率。表格后面的完整结果适用于误分类率最低的模型。

学习速率

学习速率越低,为模型中的每个新树赋予的权重就越低,有时为模型生成的树也越多。模型的学习速率越低,训练数据集的过度拟合几率就越低。学习速率低的模型通常使用更多的树来查找最优树数。

子样本部分

子样本部分是分析用于构建每个树的数据比率。

每个树的最大终端节点数

TreeNet® 分类 将许多小的 CART® 树组合到一个功能强大的模型中。该表格包括分析中的超参数,即每个树终端节点的最大数或最大树深度。具有更多终端节点的树可以对更复杂的交互作用建模。一般来说,高于 12 的值可能会减慢分析速度,而对模型没有太大好处。

最大树深度

TreeNet® 分类 将许多小的 CART® 树组合到一个功能强大的模型中。您可以为这些较小的 CART® 树指定最大终端节点数或最大树深度。更深的树可以对更复杂的交互作用建模。从 4 到 6 的值足以用于许多数据集。