发现最佳模型 (二值响应) 预测示例

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

一个研究小组收集并发布了有关影响心脏病的因素的详细信息。变量包括年龄、性别、胆固醇水平、最大心率等。本示例基于一个提供心脏病详细信息的公共数据集。原始数据来自于 archive.ics.uci.edu。

研究人员可以使用随机森林分类树模型来预测新观察的响应类概率。

  1. 完成发现最佳模型 (二值响应) 的例子
  2. 在导航器中,选择 发现最佳模型 (二值响应)的结果。
  3. 单击结果底部的 预测按钮。
  4. 从下拉列表中,选择输入单值
  5. 输入以下值。 此示例对每个预测变量使用 2 个值,但是最多可使用 3 个值。此示例还故意使用缺失值 运动绞痛
    年龄 35 35  
    血压 140 140  
    胆固醇 233 233  
    最大心率 150 165  
    旧峰值 2,3 2,3  
    性别 0 1  
    疼痛类型 2 1  
    血糖 1 1  
    静息心电图 0 1  
    运动绞痛      
    斜率 1 2  
    血管 0 2  
    地中海贫血 0 0  
  6. 单击确定

解释结果

Minitab 使用结果中的 Random Forests®分类树来估计一组预测值的心脏病诊断事件的类别概率。研究人员发现,在使用指定设置时,第一组发生心脏病诊断事件的概率约为 0.63,第二组的概率约为 0.52。

Random Forests® 分类: 心脏病 vs 年龄, 血压, 胆固醇, 最大心率, 旧峰值, 性别, 疼痛类型, 血糖, ...

方法 模型验证 使用 OOB 数据进行验证 Bootstrap 样本数 300 样本数量 与 303 的训练数据大小相同 为进行节点拆分而选定的预测变量数 预测变量总数的平方根 = 3 最小内部节点大小 8 已使用的行数 303
二值响应信息 变量 类别 计数 % 心脏病 1 (事件) 165 54.46 0 138 45.54 所有 303 100.00

Random Forests® 分类预测

心脏病 的预测

设置 年龄 = 35, 血压 = 140, 胆固醇 = 233, 最大心率 = 150, 旧峰值 = 2.3, 性别 = 0, 疼痛类型 = 2, 血糖 = 1, 静息心电图 = 0, 运动绞痛 = *, 斜率 = 1, 血管 = 0, 地中海贫血 = 0
预测 观测值 类别 概率(类别 = 1) 概率(类别 = 0) 1 1 0.626667 0.373333

心脏病 的预测

设置 年龄 = 35, 血压 = 140, 胆固醇 = 233, 最大心率 = 165, 旧峰值 = 2.3, 性别 = 1, 疼痛类型 = 1, 血糖 = 1, 静息心电图 = 1, 运动绞痛 = *, 斜率 = 2, 血管 = 2, 地中海贫血 = 0
预测 观测值 类别 概率(类别 = 1) 概率(类别 = 0) 2 1 0.516667 0.483333