の検証法を指定する CART® 分類

統計 > 予測分析 > CART®分類 > 検証

モデルをテストする検証法を選択します。通常、サンプルが小さい場合、K分割交差検証法が適切です。サンプルが大きい場合、ある割合のトレーニングに使用するケースや、テストに使用するケースを選択できます。

K分割交差検証

K分割交差検証法を使用してテストサンプルを検証するには、次のステップを実行します。K分割交差検証法は、行数が5000以下の場合のデフォルトの方法です。

  1. ドロップダウンリストからK分割交差検証を選択します。
  2. 次のいずれかを選択して、分割をランダムに割り当てるかID列を使用するかを指定します。
    • 各分割の行をランダムに割り当てる:各分割の行をランダムに選択するには、このオプションを選択します。分割数を指定できます。ほとんどの場合、デフォルト値の10が良好に機能します。低い値のKを使用すると、より多くの偏りが生じる可能性がありますが、Kの値が大きいほど、より多くの変動性が生じる可能性があります。乱数生成器の初期値を設定することもできます。
    • ID列ごとに各分割の行を割り当てる:各分割に含める行を選択するには、このオプションを選択します。ID列に、各分割の行を含む列を入力します。
  3. (オプション)K分割交差検証のID列を保存するをチェックしてID列を保存します。

テストセットによる検証

トレーニングとテストに使用するデータの割合を指定するには、次のステップを実行します。テストセットの検証法は、行数が5000を超える場合のデフォルトの方法です。多くの場合、データの70%がトレーニングに使用され、30%がテストに使用されます。

  1. ドロップダウンリストからテストセットによる検証を選択します。
  2. 行のある割合をランダムに選択するか、ID列を使用するかを指定するには、次のいずれかを選択します。
    • テストセットとして行のある割合をランダムに選択する:このオプションを選択すると、Minitabがテスト対象の行のある割合をランダムに選択します。割合を指定できます。ほとんどの場合、デフォルト値の0.3が良好に機能します。より大きなデータセットの場合は、テストに使用するデータの割合を増やす必要がある場合があります。乱数生成器の初期値を設定することもできます。
    • ID列でのトレーニング/テスト分割を定義する:テストサンプルに含める行を選択するには、このオプションを選択します。ID列に、テストサンプルに使用する行を示す列を入力します。ID列には2つの値のみを含める必要があります。テストセットのレベルで、テストサンプルとして使用する水準を選択します。
  3. (オプション)トレーニング/テスト分割のID列を保存するをチェックしてID列を保存します。

なし

なしが選択されている場合、追加の検証は実行されません。