ROC曲线下的面积与树木数量的关系, 拟合模型 发现关键预测变量 为和绘制 TreeNet® 分类

ROC 曲线下面积与树数图在 y 轴上显示 ROC 曲线下的面积,在 x 轴上显示树数。ROC 曲线下面积指示模型是否为良好的分类器。当分析使用验证方法时,图中会包含一条用于验证结果的线。利用验证结果评估模型的性能,以预测新的观测结果。对训练结果和validation结果进行比较,以查看训练数据集模型是否存在过度拟合问题。

当极大似然值确定最优模型的树数时,Minitab 随后会显示负对数似然平均值与树数图。当最小误分类率确定最优模型的树数时,Minitab 随后会显示误分类率与树数图。

解释

对于分类树,ROC 曲线下面积的值通常介于 0.5 到 1 之间。值越大表明分类模型越好。当模型可以完美地分隔类别时,曲线下面积为 1。当模型对类别的分隔程度不如随机分配时,曲线下面积为 0.5。

参考线指示检验数据的 ROC 曲线下的最优面积,以及模型中的树数。

理想情况下,验证结果的曲线随着树数增加而增加,然后在某些情况下达到最大值,才实现平衡或减少。如果验证结果曲线的最大值不理想,尝试调整学习率和子样本分数进行比较。