一个研究小组收集并发布了有关影响心脏病的因素的详细信息。变量包括年龄、性别、胆固醇水平、最大心率等。本示例基于一个提供心脏病详细信息的公共数据集。原始数据来自于 archive.ics.uci.edu。

在树创建示例中,研究人员创建了一个分类树,用于识别重要的预测变量,以指示患者是否患有心脏病。研究人员想用这棵树进行预测。

  1. 完成 CART® 分类的树创建示例
  2. 单击分类树结果底部的 预测 按钮。
  3. 从下拉列表中选择 输入单值
  4. 输入以下值。 本示例对每个预测变量使用 2 个值。选择原始数据范围内的值非常重要。本示例对每个预测变量使用 2 个值,因此第三列为空。
    年龄 35 35  
    休息血压 140 140  
    胆固醇 233 233  
    最大心率 150 165  
    老峰 2.3 2.3  
     
    禁食血糖  
    运动心绞痛 * *  
    休息心电图 0 1  
    边坡 1 3  
    塔尔 正常 正常  
    胸痛类型 2 1  
    主要船只 0 2  
  5. 单击 确定

解释结果

Minitab 使用结果中的分类树来估计 2 组预测值的类别概率。
  • 对于第一组预测值,设置与终端节点 1 的设置相同。类别预测为“否”。“否”的概率为 0.91,“是”的概率为 0.09。
  • 对于第二组预测值,设置与终端节点 4 的设置相同。类别预测为“是”。“是”的概率约为 0.74,“否”的概率约为 0.26。

7 节点 CART® 分类: 心脏病 与 年龄, 休息血压, 胆固醇, 最大心率, 老峰, 性, 禁食血糖, 运动心绞痛, 休息心电图, 边坡, 塔尔, 胸痛类型, 主要船只

方法 先验概率 对所有类别相同 节点分裂 基尼 最优树 最小误分类成本 模型验证 10 折叠交叉验证 已使用的行数 303

CART® 分类预测

心脏病 的预测

设置

年龄 = 35, 休息血压 = 140, 胆固醇 = 233, 最大心率 = 150, 老峰 = 2.3, 性 = 男性, 禁食血糖 = 真, 运动心绞痛 = *, 休息心电图 = 0, 边坡 = 1, 塔尔 = 正常, 胸痛类型 = 2, 主要船只 = 0

预测 观测值 终端节点 ID 类别 概率(类别 = 是的) 概率(类别 = 不) 1 1 不 0.09 0.91

心脏病 的预测

设置

年龄 = 35, 休息血压 = 140, 胆固醇 = 233, 最大心率 = 165, 老峰 = 2.3, 性 = 女性, 禁食血糖 = 真, 运动心绞痛 = *, 休息心电图 = 1, 边坡 = 3, 塔尔 = 正常, 胸痛类型 = 1, 主要船只 = 2

预测 观测值 终端节点 ID 类别 概率(类别 = 是的) 概率(类别 = 不) 2 4 是的 0.740741 0.259259
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策