Random Forests^® 回归示例

一组研究人员从位于爱荷华州艾姆斯的个人住宅物业的出售中收集数据。研究人员希望找出影响销售价格的变量。变量包括住宅物业的地块大小和各种功能。

使用 CART^® 回归进行初步探索以确定重要预测变量后，团队使用 Random Forests^® 回归从同一数据集创建更密集的模型。团队根据结果比较模型汇总表和 R² 图，以评估哪个模型可提供更好的预测结果。

这些数据根据一个包含有关艾姆斯住房数据的公共数据集进行了改编。来自杜鲁门州立大学 DeCock 的原始数据。

解释结果

对于此分析，观测值个数为 2930。300 个 Bootstrap 样本中的每个样本随机选择 2930 个观测值，进行替换，以创建树。该方法还使用预测变量总数的 30% 来拆分节点。此外，响应信息表显示观测值的常见描述性统计量。

均值	标准差	最小值	下四分位数	中位数	上四分位数	最大值
180796	79886.7	12789	129500	160000	213500	755000

总预测变量	77
重要预测变量	68

模型汇总表显示 R² 值与相应的 CART® 分析的 R² 值相比略有改进。