Random Forests® 回归 的模型汇总表

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

查找模型汇总表的定义和解释指南。如果您将“使用测试集验证”添加到“使用 OOB 数据进行验证”,则 Minitab 将显示两种验证方法的结果。

预测变量总数

可用于 Random Forests® 模型的预测变量总数。总数是您指定的连续预测变量数和类别预测变量数之和。

重要预测变量

Random Forests® 模型中重要预测变量的数量。重要预测变量的重要性分数大于 0.0。可以使用相对变量重要性图来显示相对变量重要性的顺序。例如,假设模型中的 20 个预测变量中有 10 个比较重要,则相对变量重要性图会按重要性顺序显示变量。

R 平方

R2 是由模型解释的响应的变异百分比。

解释

使用 R2 可确定模型与数据的拟合程度。R2 值越高,模型与数据的拟合度越好。R2 始终介于 0% 和 100% 之间。

您可以图形方式说明不同 R2 值的含义。第一个图所示为简单回归模型,该模型可解释响应中 85.5% 的变异。第二个图所示的模型可解释响应中 22.6% 的变异。模型解释的变异越多,数据点越接近拟合值。从理论上讲,如果模型可以解释 100% 的变异,则拟合值始终等于观测值,所有数据点都将落在 y = x 线上。
注意

因为 Random Forests® 使用 OOB 数据来计算 R2,但不拟合模型,模型的过度拟合不是问题。

均方根误差 (RMSE)

均方根误差 (RMSE) 衡量模型的准确度。异常值对 RMSE 的影响大于对 MAD 和 MAPE 的影响。

解释

用于比较不同模型的拟合。值越小,拟合越好。

均方误 (MSE)

均方误 (MSE) 衡量模型的准确度。异常值对 MSE 的影响大于对 MAD 和 MAPE 的影响。

解释

用于比较不同模型的拟合。值越小,拟合越好。

平均绝对偏差 (MAD)

平均绝对偏差 (MAD) 以与数据相同的单位表示准确度,这有助于使误差量概念化。异常值对 MAD 的影响小于对 R2、RMSE 和 MSE 的影响。

解释

用于比较不同模型的拟合。值越小,拟合越好。

平均绝对百分比误差 (MAPE)

平均绝对百分比误差 (MAPE) 表示相对于响应值大小的误差大小。因此,相同的大小误差对于更小值的响应变量将比更大值响应变量具有较大的 MAPE 值。由于 MAPE 为百分比,因此与其他准确度度量统计量相比,它更易于理解。例如,如果 MAPE 平均为 0.05,则所有案例的拟合误差与实际值之间的平均比值为 5%。异常值对 MAPE 的影响小于对 R2、RMSE 和 MSE 的影响。

但是,有时您可能会看到非常大的 MAPE 值,即使模型与数据的拟合情况良好也是如此。检查拟合与实际响应值图,查看是否有数据值接近 0。由于 MAPE 将绝对误差除以实际数据,因此接近 0 的值会显著加大 MAPE。

解释

用于比较不同模型的拟合。值越小,拟合越好。