指定Random Forests® 分类的验证方法

预测分析模块 > Random Forests® 分类 > 验证
注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

选择是否除 OOB 验证外,还使用检验数据集进行验证。

使用 OOB 数据进行验证

Random Forests® 分类对每个树使用自举采样。Bootstrap 样本中的每条记录都是随机选择的,并替换原始数据集中的一些值。在原始数据集的总观测值中,每个 bootstrap 样本中都会剔除一些记录。bootstrap 样本中的剔除行创建 OOB 数据集。

使用测试集和 OOB 数据验证

完成以下步骤,指定一部分数据用于训练和检验。如果选择使用测试集和 OOB 数据验证,默认情况下,Minitab 将使用 30% 的数据进行检验。

  1. 从下拉列表中,选择使用测试集和 OOB 数据验证
  2. 选择下列项之一,指定是随机选择一部分行还是使用 ID 列来选择。
    • 随机选择部分行作为测试集:选择此选项可以让 Minitab 随机选择一部分行进行检验。您可以指定比例。大多数情况下,默认值 0.3 效果良好。对于较大的数据集,您可能希望增加用于检验的数据比例。也可以为随机数生成元设置基数。
    • 按 ID 列定义训练/测试拆分:选择此选项可选择要包含在检验样本中的行。在ID 列中,输入列以指示哪些行用于检验样本。ID 列必须仅包含 2 个值。在测试集水平中,选择用作检验样本的水平。
  3. (可选)选中存储训练/测试拆分的 ID 列以保存 ID 列。