选择Random Forests® 回归的选项

预测分析模块 > Random Forests® 回归 > 选项
注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

要使树增长的 Bootstrap 样本数
输入用于确定 bootstrap 样本数和树数量的值。输入介于 3 到 3000 之间的值。
指定小于训练数据大小的 bootstrap 样本数
选择此选项可输入用于设置 bootstrap 样本数的值。必须输入大于或等于 5 的值。如果输入的数量值大于训练数据大小,Minitab 将使用等于训练数据大小的样本数量值。
节点分裂的预测变量数
指定每次节点分裂要考虑的预测变量数。通常,考虑使用预测变量总数的平方根时,分析效果良好。但是,当分析考虑将较大或较小的预测变量数用于每个节点时,某些数据集在预测变量之间具有关联,从而改进模型性能。使用平方根并查看模型后,请考虑是否更改预测变量数以尝试改进模型的性能。
  • 预测变量总数的平方根:选择此选项可将预测变量总数的平方根用于分裂节点。
  • 预测变量总数,生成自举森林:选择此选项可将所有预测变量用于分裂节点。此选项创建的森林称为自举森林。
  • 预测变量总数的百分 K;K =:选择此选项可将一定百分比的预测变量用于分裂节点。
随机数生成元基数
您可以为随机数生成元指定基数,以随机选择子样本和预测变量子集。通常,不需要更改基数。您可以更改基数以探索结果对随机选择的敏感性,或确保重复分析的随机选择相同。
用于拆分内部节点的最小案例数

输入节点可以拥有且仍可分裂为更多节点的最小案例数。在样本数量为 2,000 或更小时,默认值为 2,以便所有节点都可以分裂为更小的节点,直到无法进行另一次分裂。对于更大的样本数量,默认值为 5。如果模型性能不足,请考虑是否更改此值,以查看对性能的影响。