Random Forests® 分类 预测示例

注意

此命令可用于“预测分析”附加模块。单击此处了解如何激活模块

一个研究小组收集并发布了有关影响心脏病的因素的详细信息。变量包括年龄、性别、胆固醇水平、最大心率等。本示例基于一个提供心脏病详细信息的公共数据集。原始数据来自于 archive.ics.uci.edu。

The researcher can use the random forest classification tree model to predict response class probabilities for new observations with great accuracy.

  1. 完成Random Forests® 分类示例
  2. 单击结果底部的预测按钮。
  3. 从下拉列表中,选择输入单值
  4. 输入以下值。 You can use up to 3 values. 选择原始数据范围内的值非常重要。
    年龄 35 35  
    血压 140 140  
    胆固醇 233 233  
    最大心率 150 165  
    旧峰值 2.3 2.3  
    性别  
    疼痛类型 2 1  
    血糖  
    静息心电图 0 1  
    运动绞痛      
    斜率 1 3  
    血管 0 2  
    地中海贫血 正态 正态  
  5. 单击确定

解释结果

Minitab uses the random forest classification trees in the results to estimate the class probability of a heart disease diagnosis event for the a set of prediction values. The researchers find that the probability of a heart disease diagnosis event using the specified settings is approximately 0.83 for the first set and 0.62 for the second set.

Random Forests® 分类: 心脏病 vs 年龄, 休息血压, 胆固醇, 最大心率, 老峰, 性, 胸痛类型, 禁食血糖, ...

方法 模型验证 使用 OOB 数据进行验证 Bootstrap 样本数 300 样本数量 与 303 的训练数据大小相同 为进行节点拆分而选定的预测变量数 预测变量总数的平方根 = 3 最小内部节点大小 2 已使用的行数 303
二值响应信息 变量 类别 计数 % 心脏病 是的 (事件) 139 45.87 不 164 54.13 所有 303 100.00
预测... Random Forests® 分类预测

心脏病 的预测

设置 年龄 = 35, 休息血压 = 140, 胆固醇 = 233, 最大心率 = 150, 老峰 = 2.3, 性 = 男性, 胸痛类型 = 2, 禁食血糖 = 真, 休息心电图 = 0, 运动心绞痛 = "", 边坡 = 1, 主要船只 = 0, 塔尔 = 正常
预测 观测值 类别 概率(类别 = 是的) 概率(类别 = 不) 1 不 0.17 0.83

心脏病 的预测

设置 年龄 = 35, 休息血压 = 140, 胆固醇 = 233, 最大心率 = 165, 老峰 = 2.3, 性 = 女性, 胸痛类型 = 1, 禁食血糖 = 真, 休息心电图 = 1, 运动心绞痛 = "", 边坡 = 3, 主要船只 = 2, 塔尔 = 正常
预测 观测值 类别 概率(类别 = 是的) 概率(类别 = 不) 2 不 0.383333 0.616667