预测示例 CART® 分类

一个研究小组收集并发布了有关影响心脏病的因素的详细信息。变量包括年龄、性别、胆固醇水平、最大心率等。本示例基于一个提供心脏病详细信息的公共数据集。原始数据来自于 archive.ics.uci.edu。

在树创建示例中,研究人员创建了一个分类树,用于识别重要的预测变量,以指示患者是否患有心脏病。研究人员想用这棵树进行预测。

  1. 完成CART® 分类示例
  2. 单击分类树结果底部的 预测 按钮。
  3. 从下拉列表中,选择输入单值
  4. 输入以下值。 本示例对每个预测变量使用 2 个值。选择原始数据范围内的值非常重要。本示例对每个预测变量使用 2 个值,因此第三列为空。
    年龄 35 35  
    血压 140 140  
    胆固醇 233 233  
    最大心率 150 165  
    旧峰值 2.3 2.3  
    性别  
    疼痛类型 2 1  
    血糖  
    静息心电图 0 1  
    运动绞痛      
    斜率 1 3  
    血管 0 2  
    地中海贫血 正态 正态  
  5. 单击 确定

解释结果

Minitab 使用结果中的分类树来估计 2 组预测值的类别概率。
  • 对于第一组预测值,设置与终端节点 1 的设置相同。类别预测为“否”。“否”的概率为 0.91,“是”的概率为 0.09。
  • 对于第二组预测值,设置与终端节点 4 的设置相同。类别预测为“是”。“是”的概率约为 0.74,“否”的概率约为 0.26。

心脏病 的预测

设置

年龄 = 35,血压 = 140,胆固醇 = 233,最大心率 = 150,旧峰值 = 2.3,性别 = 男性,疼痛类型 = 2,
血糖 = 真,静息心电图 = 0,运动绞痛 = "",斜率 = 1,血管 = 0,地中海贫血 = 正常

预测

观测值终端节点 ID类别概率(类别 = 是的)概率(类别 = 不)
110.090.91

心脏病 的预测

设置

年龄 = 35,血压 = 140,胆固醇 = 233,最大心率 = 165,旧峰值 = 2.3,性别 = 女性,疼痛类型 = 1,
血糖 = 真,静息心电图 = 1,运动绞痛 = "",斜率 = 3,血管 = 2,地中海贫血 = 正常

预测

观测值终端节点 ID类别概率(类别 = 是的)概率(类别 = 不)
24是的0.7407410.259259