此命令适用于 预测分析模块。单击此处了解更多关于如何激活模块的信息。
可在分析中构建您指定的任意数量的树,并根据每个树中的信息对模型进行较小的改动。如果分析中包含验证方法,则分析为每个树数计算训练数据和检验数据的模型选择标准的值。测试集的最优值决定了最优模型中的树数。
当用于计算优化标准的数据与用于拟合模型的数据相同时,得到的优化标准(如最大对数似然)往往倾向于乐观。模型验证方法将部分数据排除在模型拟合过程外,然后计算统计量以评估模型在忽略的数据上的性能。模型验证技术可以更好地估计模型在新数据上的效果如何。根据您选择的分析内容,标准为最大对数似然、ROC 曲线下最大面积或最小误分类率。Minitab 提供了两种验证方法:k 折叠交叉验证和使用单独的测试集进行验证。
当数据具有的案例少于或等于 2000 时,K 折叠交叉验证是 Minitab 中的默认方法。由于该过程会重复 K 次,因此交叉验证通常比“使用测试集验证”要慢。
在使用测试集验证时,将留出一部分数据进行验证。其余数据是训练集。首先,Minitab 使用训练集生成树序列。然后,Minitab 使用测试集计算每个树数的模型选择标准值。具有最佳值的树数构成了最优模型。
没有任何验证时,Minitab 使用整个数据集来拟合模型。最终模型包含数量最多的树。