预测示例 - CART® 分类

一个研究小组收集并发布了有关影响心脏病的因素的详细信息。变量包括年龄、性别、胆固醇水平、最大心率等。本示例基于一个提供心脏病详细信息的公共数据集。原始数据来自于 archive.ics.uci.edu。

在树创建示例中,研究人员创建了一个分类树,用于识别重要的预测变量,以指示患者是否患有心脏病。研究人员想用这棵树进行预测。

  1. 完成 CART® 分类示例
  2. 单击分类树结果底部的 预测 按钮。
  3. 从下拉列表中选择 输入单值
  4. 输入以下值。 本示例对每个预测变量使用 2 个值。选择原始数据范围内的值非常重要。本示例对每个预测变量使用 2 个值,因此第三列为空。
    年龄 35 35  
    血压 140 140  
    胆固醇 233 233  
    最大心率 150 165  
    旧峰值 2.3 2.3  
    性别  
    疼痛类型 2 1  
    血糖  
    静息心电图 0 1  
    运动绞痛      
    斜率 1 3  
    血管 0 2  
    地中海贫血 正常 正常  
  5. 单击 确定

解释结果

Minitab 使用结果中的分类树来估计 2 组预测值的类别概率。
  • 对于第一组预测值,设置与终端节点 1 的设置相同。类别预测为“否”。“否”的概率为 0.91,“是”的概率为 0.09。
  • 对于第二组预测值,设置与终端节点 4 的设置相同。类别预测为“是”。“是”的概率约为 0.74,“否”的概率约为 0.26。

7 节点 CART® 分类: 心脏病 与 年龄, 血压, 胆固醇, 最大心率, 旧峰值, 性别, 血糖, 运动绞痛, 静息心电图, 斜率, 地中海贫血, 疼痛类型, 血管

方法 先验概率 对所有类别相同 节点分裂 基尼 最优树 最小误分类成本 模型验证 10 折叠交叉验证 已使用的行数 303

CART® 分类预测

心脏病 的预测

设置 年龄 = 35, 血压 = 140, 胆固醇 = 233, 最大心率 = 150, 旧峰值 = 2.3, 性别 = 男性, 疼痛类型 = 2, 血糖 = 真, 静息心电图 = 0, 运动绞痛 = "", 斜率 = 1, 血管 = 0, 地中海贫血 = 正常
预测 观测值 终端节点 ID 类别 概率(类别 = 是的) 概率(类别 = 不) 1 1 不 0.09 0.91

心脏病 的预测

设置 年龄 = 35, 血压 = 140, 胆固醇 = 233, 最大心率 = 165, 旧峰值 = 2.3, 性别 = 女性, 疼痛类型 = 1, 血糖 = 真, 静息心电图 = 1, 运动绞痛 = "", 斜率 = 3, 血管 = 2, 地中海贫血 = 正常
预测 观测值 终端节点 ID 类别 概率(类别 = 是的) 概率(类别 = 不) 2 4 是的 0.740741 0.259259