Random Forests® 分类 的累积提升图的方法和公式

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

累积提升的计算过程取决于验证方法。对于多项式响应变量,Minitab 会显示多个图表,这些图表依次将每个类别视为事件。

OOB

对于森林中的给定树,在 OOB 数据中对一行的类别投票是单个树中行的预测类别。在 OOB 数据中,行的预测类别是森林中所有树中投票率最高的类别。OOB 数据中一行的预测类别概率是该行的类别票数和总票数之比。

对于 OOB 数据的曲线,图表上的每个点都表示可区分的预测类别概率。最高事件概率是图表上的第一个点,显示在最左侧。其他概率按降序排列。

累积提升图上的点是根据 ROC 曲线图表上的点计算得出的。累积提升图的 y 坐标为(真阳率百分比/x 坐标的总体累积百分比)。真阳率的计算与 ROC 曲线图表完全相同。

图的 x 坐标具有以下形式:

其中, 是拟合概率大于阈值的行数,N 是合计行数。有关阈值的详细信息,请转到 Random Forests® 分类 的接受者操作特性 (ROC) 曲线图的方法和公式

单独的测试集

使用与训练数据集案例相同的步骤,但从测试集的案例中计算事件概率。