使用 TreeNet® 分类拟合模型发现关键预测变量 的混淆矩阵

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

查找混淆矩阵中每个统计量的定义和解释。
混淆矩阵使用以下度量来显示树分隔类别的正确程度:
  • 真阳率 (TPR) = 正确预测事件案例的概率
  • 假阳率 (FPR) = 非事件案例预测错误的概率
  • 假阴率 (FNR) = 事件案例预测错误的概率
  • 真阴率 (TNR) = 正确预测非事件案例的概率

解释

TreeNet® 分类: 心脏病 vs 年龄, 血压, 胆固醇, 最大心率, 旧峰值, 性别, 疼痛类型, 血糖, ...

混淆矩阵 预测类别(训练) 预测类别(测试) 实际类别 计数 是的 不 正确百分比 是的 不 正确百分比 是的 (事件) 139 124 15 89.21 110 29 79.14 不 164 8 156 95.12 24 140 85.37 所有 303 132 171 92.41 134 169 82.51 如果行的事件概率超过 0.5,则将行分配给事件类。
统计量 训练 (%) 测试 (%) 真阳率(敏感度或功效) 89.21 79.14 假阳率(I 类错误) 4.88 14.63 假阴率(II 类错误) 10.79 20.86 真阴率(特异度) 95.12 85.37

在此示例中,“是”事件的总数为 139,而“否”的总数为 164。
  • 在训练数据中,预测的事件(是)的数量为 124,正确率为 89.21%。
  • 在训练数据中,预测的非事件(否)的数量为 156,正确率为 95.12%。
  • 在检验数据中,预测的事件(是)的数量为 110,正确率为 79.14%。
  • 在检验数据中,预测的非事件(否)的数量为 140,正确率为 85.37%。
总体而言,训练数据的正确百分比为 92.41%,检验数据的正确百分比为 82.51%。使用检验数据的结果可评估新观测值的预测准确度。

正确百分比低通常是由于模型拟合不足导致的,模型拟合不足可能由多种不同原因引起。如果正确百分比非常低,请考虑类别权重是否会有帮助。当一个类别中观测值的权重大于另一个类别中观测值的权重时,类别权重可能会有助于提供更准确的模型。此外,您还可以更改将案例归为事件的概率。