Random Forests® 分類の検証法を指定する

予測分析モジュール > Random Forests®分類 > 検証

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

アウトオブバッグの検証に加えて、テストデータセットを使用して検証するかどうかを選択します。

アウトオブバッグデータを使用した検証

Random Forests® 分類では、すべての木にブートストラップサンプリングを使用します。ブートストラップサンプルのすべてのレコードは、元のデータセットの置換と共にランダムに選択されます。元のデータセットの総観測値のうち、すべてのブートストラップサンプルからいくつかのレコードが除外されます。ブートストラップサンプルの残された行は、アウトオブバッグデータセットを作成します。

アウトオブバッグデータに加えて、テストセットを使用した検証

トレーニングとテストに使用するデータの割合を指定するには、次のステップを実行します。アウトオブバッグデータに加えて、テストセットを使用した検証を選択すると、デフォルトでは、テスト用にデータの30%が使用されます。

  1. ドロップダウンリストからアウトオブバッグデータに加えて、テストセットを使用した検証を選択します。
  2. 行のある割合をランダムに選択するか、ID列を使用するかを指定するには、次のいずれかを選択します。
    • テストセットとして行のある割合をランダムに選択する: このオプションを選択すると、Minitabがテスト対象の行のある割合をランダムに選択します。割合を指定できます。ほとんどの場合、デフォルト値の0.3が良好に機能します。より大きなデータセットの場合は、テストに使用するデータの割合を増やす必要がある場合があります。乱数生成器の初期値を設定することもできます。
    • ID列でのトレーニング/テスト分割を定義する: テストサンプルに含める行を選択するには、このオプションを選択します。ID列に、テストサンプルに使用する行を示す列を入力します。ID列には2つの値のみを含める必要があります。テストセットのレベルで、テストサンプルとして使用する水準を選択します。
  3. (オプション)トレーニング/テスト分割のID列を保存するをチェックしてID列を保存します。