TreeNet® 分类 预测示例

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

一个研究小组收集并发布了有关影响心脏病的因素的详细信息。变量包括年龄、性别、胆固醇水平、最大心率等。本示例基于一个提供心脏病详细信息的公共数据集。原始数据来自于 archive.ics.uci.edu。

研究人员可以使用梯度提升分类树模型,以便预测新观测值的响应类别概率。

注意

此示例使用来自 拟合模型 的数据集,但使用 发现关键预测变量 创建模型时预测也是可用的。

  1. 完成使用 TreeNet® 分类 的 拟合模型 的示例
  2. 单击结果底部的预测按钮。
  3. 从下拉列表中,选择输入单值
  4. 输入以下值。 此示例对每个预测变量使用 2 个值,但是最多可使用 3 个值。
    年龄 35 35  
    血压 140 140  
    胆固醇 233 233  
    最大心率 150 165  
    旧峰值 2.3 2.3  
    性别  
    疼痛类型 2 1  
    血糖  
    静息心电图 0 1  
    运动绞痛      
    斜率 1 3  
    血管 0 2  
    地中海贫血 正态 正态  
  5. 单击确定

解释结果

Minitab 使用结果中的梯度提升分类树来估计一组预测值的心脏病事件的类别概率。研究人员发现,在使用指定设置时,第一组发生心脏病事件的概率约为 0.15,第二组的概率约为 0.43。

TreeNet® 分类: 心脏病 vs 年龄, 血压, 胆固醇, 最大心率, 旧峰值, 性别, 疼痛类型, 血糖, ...

模型汇总 总预测变量 13 重要预测变量 13 增长的树数 500 最优树数 351 统计量 训练 测试 负对数似然平均值 0.2341 0.3865 ROC 曲线下面积 0.9825 0.9089 95% 置信区间 (0.9706, 0.9945) (0.8757, 0.9421) 提升 2.1799 2.1087 误分类率 0.0759 0.1750
调整超参数以确定更好的模型... 单变量部分依赖图

选择更多要绘制的预测变量...

双变量部分依赖图

选择更多要绘制的预测变量...

预测... TreeNet® 分类预测

心脏病 的预测

设置 年龄 = 35, 血压 = 140, 胆固醇 = 233, 最大心率 = 150, 旧峰值 = 2.3, 性别 = 男性, 疼痛类型 = 2, 血糖 = 真, 静息心电图 = 0, 运动绞痛 = "", 斜率 = 1, 血管 = 0, 地中海贫血 = 正常
预测 观测值 类别 概率(类别 = 是的) 概率(类别 = 不) 1 不 0.145216 0.854784

心脏病 的预测

设置 年龄 = 35, 血压 = 140, 胆固醇 = 233, 最大心率 = 165, 旧峰值 = 2.3, 性别 = 女性, 疼痛类型 = 1, 血糖 = 真, 静息心电图 = 1, 运动绞痛 = "", 斜率 = 3, 血管 = 2, 地中海贫血 = 正常
预测 观测值 类别 概率(类别 = 是的) 概率(类别 = 不) 2 不 0.426671 0.573329