使用 TreeNet® 分类拟合模型发现关键预测变量 的混淆矩阵

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

查找混淆矩阵中每个统计量的定义和解释。
混淆矩阵使用以下度量来显示树分隔类别的正确程度:
  • 真阳率 (TPR) = 正确预测事件案例的概率
  • 假阳率 (FPR) = 非事件案例预测错误的概率
  • 假阴率 (FNR) = 事件案例预测错误的概率
  • 真阴率 (TNR) = 正确预测非事件案例的概率

解释

混淆矩阵



预测类别(训练)预测类别(测试)
实际类别计数是的正确百分比是的正确百分比
是的 (事件)1391241589.211102979.14
164815695.122414085.37
所有30313217192.4113416982.51
如果行的事件概率超过 0.5,则将行分配给事件类。
     
统计量训练 (%)测试 (%)
真阳率(敏感度或功效)89.2179.14
假阳率(I 类错误)4.8814.63
假阴率(II 类错误)10.7920.86
真阴率(特异度)95.1285.37

在此示例中,“是”事件的总数为 139,而“否”的总数为 164。
  • 在训练数据中,预测的事件(是)的数量为 124,正确率为 89.21%。
  • 在训练数据中,预测的非事件(否)的数量为 156,正确率为 95.12%。
  • 在检验数据中,预测的事件(是)的数量为 110,正确率为 79.14%。
  • 在检验数据中,预测的非事件(否)的数量为 140,正确率为 85.37%。
总体而言,训练数据的正确百分比为 92.41%,检验数据的正确百分比为 82.51%。使用检验数据的结果可评估新观测值的预测准确度。

正确百分比低通常是由于模型拟合不足导致的,模型拟合不足可能由多种不同原因引起。如果正确百分比非常低,请考虑类别权重是否会有帮助。当一个类别中观测值的权重大于另一个类别中观测值的权重时,类别权重可能会有助于提供更准确的模型。此外,您还可以更改将案例归为事件的概率。