和 的混淆矩阵 拟合模型 发现关键预测变量 TreeNet® 分类

查找混淆矩阵中每个统计量的定义和解释。
混淆矩阵使用以下度量来显示树分隔类别的正确程度:
  • 真阳率 (TPR) = 正确预测事件案例的概率
  • 假阳率 (FPR) = 非事件案例预测错误的概率
  • 假阴率 (FNR) = 事件案例预测错误的概率
  • 真阴率 (TNR) = 正确预测非事件案例的概率

解释

混淆矩阵



预测类别(训练)预测类别 (交叉验证)
实际类别计数是的正确百分比是的正确百分比
是的 (事件)1391241589.211102979.14
164815695.122414085.37
所有30313217192.4113416982.51
如果行的事件概率超过 0.5,则将行分配给事件类。
     
统计量训练 (%)交叉验证 (%)
真阳率(敏感度或功效)89.2179.14
假阳率(I 类错误)4.8814.63
假阴率(II 类错误)10.7920.86
真阴率(特异度)95.1285.37

在此示例中,“是”事件的总数为 139,而“否”的总数为 164。
  • 在训练数据中,预测的事件(是)的数量为 124,正确率为 89.21%。
  • 在训练数据中,预测的非事件(否)的数量为 156,正确率为 95.12%。
  • 交叉验证结果显示预测事件数为110个(是),准确率为79.14%。
  • 交叉验证结果中,预测非事件(No)数量为140个,准确率为85.37%。
总体而言,培训正确率为92.41%,交叉验证为82.51%。使用检验数据的结果可评估新观测值的预测准确度。

正确百分比低通常是由于模型拟合不足导致的,模型拟合不足可能由多种不同原因引起。如果正确百分比非常低,请考虑类别权重是否会有帮助。当一个类别中观测值的权重大于另一个类别中观测值的权重时,类别权重可能会有助于提供更准确的模型。此外,你还可以更改案件被归类为事件所需的概率。