此命令适用于 预测分析模块。单击此处了解更多关于如何激活模块的信息。
TreeNet® 模型是解决分类和回归问题的方法,与单一分类或回归树相比,既准确又不易过度拟合。宽泛而言,在该过程刚开始时我们将使用一个小回归树作为初始模型。从该树上,数据中的每一行都有残差,这些残差成为下一个回归树的响应变量。我们构建另一个回归小树来预测第一个树的残差并再次计算产生的残差。我们重复此序列,直到使用验证方法确定具有最小预测误差的最优树数量。生成的树序列形成 TreeNet® 回归模型。
对于回归案例,我们可以添加分析的一般说明,但一些详细信息取决于以下哪种是损失函数:
统计量 | 文字转数字 (Value) |
---|---|
初始拟合, | 响应变量的均值 |
广义残差, 作为第 i 行的响应值 | |
在节点更新中, | 的均值 |
统计量 | 文字转数字 (Value) |
---|---|
初始拟合, | 响应变量的中位数 |
广义残差, 作为第 i 行的响应值 | |
在节点更新中, | 的中位数 |
对于 Huber 损失函数,统计量如下:
初始拟合,,等于所有响应值的中位数。
为了生成第 j 个树,
之后,第 i 行的广义残差如下所示:
广泛残差用作响应值,以生成第 j 个树。
第 j 个树的第 m 个终端节点中行的更新值如下:
在第 j 个树的终端节点 m 内的所有行中计算前面表达式中的平均值。
在前面的详细信息中, 是第 i 行的响应变量的值, 是前面的 j – 1 树的拟合值,而 是代表训练数据中预测变量值的第 i 行的矢量。
输入 | 符号 |
---|---|
学习速率 | |
抽样率 | |
每个树的最大终端节点数 | |
树数 | |
切换值 |