此命令适用于 预测分析模块。单击此处了解更多关于如何激活模块的信息。
一组研究人员从位于爱荷华州艾姆斯的个人住宅物业的出售中收集数据。研究人员希望找出影响销售价格的变量。变量包括住宅物业的地块大小和各种功能。
使用 CART® 回归 进行初步探索以确定重要预测变量后,团队使用 Random Forests® 回归 从同一数据集创建更密集的模型。团队根据结果比较模型汇总表和 R2 图,以评估哪个模型可提供更好的预测结果。
这些数据根据一个包含有关艾姆斯住房数据的公共数据集进行了改编。来自杜鲁门州立大学 DeCock 的原始数据。
模型验证 | 使用 OOB 数据进行验证 |
---|---|
Bootstrap 样本数 | 300 |
样本数量 | 与 2930 的训练数据大小相同 |
为进行节点拆分而选定的预测变量数 | 预测变量总数的 30% = 23 |
最小内部节点大小 | 5 |
已使用的行数 | 2930 |
均值 | 标准差 | 最小值 | 下四分位数 | 中位数 | 上四分位数 | 最大值 |
---|---|---|---|---|---|---|
180796 | 79886.7 | 12789 | 129500 | 160000 | 213500 | 755000 |
总预测变量 | 77 |
---|---|
重要预测变量 | 68 |
统计量 | OOB |
---|---|
R 平方 | 90.90% |
均方根误差 (RMSE) | 24097.3281 |
均方误差 (MSE) | 5.80681E+08 |
平均绝对偏差 (MAD) | 14746.8323 |
平均绝对百分比误差 (MAPE) | 0.0895 |
模型汇总表显示 R2 值与相应的 CART® 分析的 R2 值相比略有改进。