发现最佳模型 (连续响应) 的超参数优化

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

查找方法表的定义和解释指南。

创建模型后 发现最佳模型 (连续响应),您可以单击 选择备择模型 以探索其他模型。如果您选择 Random Forests® 模型,一种选择是指定超参数以适应新模型。如果指定超参数,则结果包括超参数表的优化。该表比较了超参数的组合。超参数表优化后的结果是用于具有最佳标准最大值的模型,如最大 R2

R 平方

R2 是由模型解释的响应的变异百分比。

解释

使用 R2 可确定模型与数据的拟合程度。R2 值越高,模型与数据的拟合度越好。R2 始终介于 0% 和 100% 之间。

您可以图形方式说明不同 R2 值的含义。第一个图所示为简单回归模型,该模型可解释响应中 85.5% 的变异。第二个图所示的模型可解释响应中 22.6% 的变异。模型解释的变异越多,数据点越接近拟合值。从理论上讲,如果模型可以解释 100% 的变异,则拟合值始终等于观测值,所有数据点都将落在 y = x 线上。
注意

因为 Random Forests® 使用 OOB 数据来计算 R2,但不拟合模型,模型的过度拟合不是问题。

平均绝对偏差 (MAD)

平均绝对偏差 (MAD) 以与数据相同的单位表示准确度,这有助于使误差量概念化。异常值对 MAD 的影响小于对 R2 的影响。

解释

用于比较不同模型的拟合。值越小,拟合越好。

节点分裂的预测器计数

此行表示要考虑的预测器数数的选择。

最小内部节点大小

最小内部节点大小指示节点可以拥有且仍可分裂为更多节点的最小案例数。

Bootstrap 样本数

Bootstrap 样本数表示分析中的树数。