Random Forests® 分类 的收益图的方法和公式

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

收益图上各个点的过程取决于验证方法。对于多项式响应变量,Minitab 会显示多个图表,这些图表依次将每个类别视为事件。

OOB

对于森林中的给定树,在 OOB 数据中对一行的类别投票是单个树中行的预测类别。在 OOB 数据中,行的预测类别是森林中所有树中投票率最高的类别。OOB 数据中一行的预测类别概率是该行的类别票数和总票数之比。

对于 OOB 数据的曲线,图表上的每个点都表示可区分的预测类别概率。最高事件概率是图表上的第一个点,显示在最左侧。其他概率按降序排列。

收益图的 y 坐标是百分比尺度的真阳率。真阳率的计算与 ROC 曲线图表相同。图的 x 坐标具有以下形式:

其中, 是拟合概率大于阈值的行数,N 是合计行数。有关阈值的详细信息,请转到 Random Forests® 分类 的接受者操作特性 (ROC) 曲线图的方法和公式

单独的测试集

使用与训练集案例相同的步骤,但从测试集的案例中计算事件概率。