此命令适用于 预测分析模块。单击此处了解更多关于如何激活模块的信息。
对于森林中的给定树,在 OOB 数据中对一行的类别投票是单个树中行的预测类别。在 OOB 数据中,行的预测类别是森林中所有树中投票率最高的类别。OOB 数据中一行的预测类别概率是该行的类别票数和总票数之比。
对于 OOB 数据的曲线,图表上的每个点都表示可区分的预测类别概率。最高事件概率是图表上的第一个点,显示在最左侧。其他概率按降序排列。
使用以下过程查找图表的 x 坐标和 y 坐标。
例如,假设下表汇总了具有两个两水平类别预测变量的简化模型。这些预测变量提供四个可区分事件概率,四舍五入至小数点后 2 位:
A:订单 | B:预测变量 1 | C: 预测变量 2 | D:事件数 | E:非事件数 | F:试验数 | G:阈值(拟合事件概率) |
---|---|---|---|---|---|---|
1 | 1 | 1 | 18 | 12 | 30 | 0.60 |
2 | 1 | 2 | 25 | 42 | 67 | 0.37 |
3 | 2 | 1 | 12 | 44 | 56 | 0.21 |
4 | 2 | 2 | 4 | 32 | 36 | 0.11 |
合计 | 59 | 130 | 189 |
以下是相应的四个表,它们各自的假阳率和真阳率四舍五入至小数点后 2 位:
预测 | |||
---|---|---|---|
事件 | 非事件 | ||
观测 | 事件 | 18 | 41 |
非事件 | 12 | 118 |
预测 | |||
---|---|---|---|
事件 | 非事件 | ||
观测 | 事件 | 43 | 16 |
非事件 | 54 | 76 |
预测 | |||
---|---|---|---|
事件 | 非事件 | ||
观测 | 事件 | 55 | 4 |
非事件 | 98 | 32 |
预测 | |||
---|---|---|---|
事件 | 非事件 | ||
观测 | 事件 | 59 | 0 |
非事件 | 130 | 0 |
使用与 OOB 程序相同的步骤,但从测试集的案例中计算事件概率。