此命令适用于 预测分析模块。单击此处了解更多关于如何激活模块的信息。
TreeNet® 模型是解决分类和回归问题的方法,与单一分类或回归树相比,既准确又不易过度拟合。宽泛而言,在该过程刚开始时我们将使用一个小回归树作为初始模型。从该树上,数据中的每一行都有残差,这些残差成为下一个回归树的响应变量。我们构建另一个回归小树来预测第一个树的残差并再次计算产生的残差。我们重复此序列,直到使用验证方法确定具有最小预测误差的最优树数量。生成的树序列形成 TreeNet® 分类模型。
对于分类案例,我们可以为具有二元响应的分析和具有多项式响应的分析添加一些更多的数学细节。
其中, 是事件数, 是非事件数。
输入 | 符号 |
---|---|
学习速率 | |
抽样率 | |
每个树的最大终端节点数 | |
树数 |
并且 是代表训练数据中预测变量值的第 i 行的矢量。
项 | 说明 |
---|---|
树 j 处终端节点 m 中的事件数 | |
树 j 处终端节点 m 中的案例数 | |
以下项的算术均值:(对于树 j 处终端节点 m 中的所有情况) |
其中, 是案例数,其中响应值是 k,N 是训练数据中的行数。
输入 | 符号 |
---|---|
学习速率 | |
抽样率 | |
每个树的最大终端节点数 | |
树数 |
根据拟合值计算概率时将考虑这些树的依存性质。否则,该过程与二元案例基本相同。
其中,
并且 是一个代表训练数据集中预测变量值第i 行的矢量。
其中,
项 | 说明 |
---|---|
在树 j 处终端节点 m 中的结果 k 的案例数 | |
树 j 处终端节点 m 中的案例数 | |
以下项的算术均值:(对于树 j 处终端节点 m 中的所有情况)。 |