此命令适用于 预测分析模块。单击此处了解更多关于如何激活模块的信息。
对于森林中的给定树,在 OOB 数据中对一行的类别投票是单个树中行的预测类别。在 OOB 数据中,行的预测类别是森林中所有树中投票率最高的类别。OOB 数据中一行的预测类别概率是该行的类别票数和总票数之比。
对于 OOB 数据的曲线,图表上的每个点都表示可区分的预测类别概率。最高事件概率是图表上的第一个点,显示在最左侧。其他概率按降序排列。
累积提升图上的点是根据 ROC 曲线图表上的点计算得出的。累积提升图的 y 坐标为(真阳率百分比/x 坐标的总体累积百分比)。真阳率的计算与 ROC 曲线图表完全相同。
其中, 是拟合概率大于阈值的行数,N 是合计行数。有关阈值的详细信息,请转到 Random Forests® 分类 的接受者操作特性 (ROC) 曲线图的方法和公式。
使用与训练数据集案例相同的步骤,但从测试集的案例中计算事件概率。