预测示例 发现最佳模型 (二值响应)

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

一个研究小组收集并发布了有关影响心脏病的因素的详细信息。变量包括年龄、性别、胆固醇水平、最大心率等。本示例基于一个提供心脏病详细信息的公共数据集。原始数据来自于 archive.ics.uci.edu。

研究人员可以使用 Random Forest 分类树模型,以便预测新观测值的响应类别概率。

  1. 完成发现最佳模型 (二值响应)示例
  2. 在导航器中,选择 的结果 发现最佳模型 (二值响应)
  3. 在结果中选择 预测
  4. 从下拉列表中,选择输入单值
  5. 输入以下值。 此示例对每个预测变量使用 2 个值,但是最多可使用 3 个值。此示例还特意使用 的缺失值。 运动绞痛
    年龄 35 35  
    血压 140 140  
    胆固醇 233 233  
    最大心率 150 165  
    旧峰值 2.3 2.3  
    性别 0 1  
    疼痛类型 2 1  
    血糖 1 1  
    静息心电图 0 1  
    运动绞痛      
    斜率 1 2  
    血管 0 2  
    地中海贫血 0 0  
  6. 单击 确定

解释结果

Minitab 在结果中使用随机森林® 模型来估计两组预测值的心脏病诊断事件的类别概率。研究人员发现,在使用指定设置时,第一组发生心脏病诊断事件的概率约为 0.63,第二组的概率约为 0.52。

心脏病 的预测

设置

年龄 = 35,血压 = 140,胆固醇 = 233,最大心率 = 150,旧峰值 = 2.3,性别 = 0,疼痛类型 = 2,血糖 = 1,
静息心电图 = 0,运动绞痛 = *,斜率 = 1,血管 = 0,地中海贫血 = 0

预测

观测值类别概率(类别 = 1)概率(类别 = 0)
110.6266670.373333

心脏病 的预测

设置

年龄 = 35,血压 = 140,胆固醇 = 233,最大心率 = 165,旧峰值 = 2.3,性别 = 1,疼痛类型 = 1,血糖 = 1,
静息心电图 = 1,运动绞痛 = *,斜率 = 2,血管 = 2,地中海贫血 = 0

预测

观测值类别概率(类别 = 1)概率(类别 = 0)
210.5166670.483333