MARS® 回帰の検証法を指定する

予測分析モジュール > MARS® 回帰 > 検証

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

モデルをテストする検証法を選択します。通常、サンプルが小さい場合は、K分割交差検証法が適しています。サンプルが大きい場合は、ある割合のトレーニングに使用するケースや、テストに使用するケースを選択できます。

K分割交差検証

K分割交差検証法を使用してテストサンプルを検証する場合は、次のステップを実行します。K分割交差検証法は、行数が2000以下の場合のデフォルトの方法です。

  1. ドロップダウンリストからK分割交差検証を選択します。
  2. 次のいずれかを選択して、分割をランダムに割り当てるか、ID列を使用するかを指定します。
    • 各分割の行をランダムに割り当てる: 各分割に対して行をランダムに選択するには、このオプションを選択します。分割数を指定できます。ほとんどの場合、デフォルト値の5が良好に機能します。フォールドの数が多いほど、特に行数が少ないデータセットの場合、より信頼性の高い予測モデルを選択する可能性が高くなりますが、計算時間が大幅に増加する可能性があります。
    • ID列ごとに各分割の行を割り当てる: 各分割に含める行を選択するには、このオプションを選択します。ID列に、各分割の行を含む列を入力します。
  3. (オプション)K分割交差検証のID列を保存するを選択してID列を保存します。

テストセットによる検証

トレーニングとテストに使用するデータの一部を指定するには、次の手順を実行します。テストセットの検証法は、行数が2000を超える場合のデフォルトの方法です。多くの場合、データの 70% がトレーニングに使用され、データの 30% がテストに使用されます。

  1. ドロップダウンリストからテストセットによる検証を選択します。
  2. 行のある割合をランダムに選択するか、ID列を使用するかを指定するには、次のいずれかを選択します。
    • テストセットとして行のある割合をランダムに選択する: このオプションを選択すると、Minitabがテスト対象の行のある割合をランダムに選択します。割合を指定できます。ほとんどの場合、デフォルト値の0.3が良好に機能します。より大きなデータセットの場合は、テストに使用するデータの割合を増やす必要がある場合があります。乱数生成器の初期値を設定することもできます。
    • ID列でのトレーニング/テスト分割を定義する: テストサンプルに含める行を選択するには、このオプションを選択します。ID列に、テストサンプルに使用する行を示す列を入力します。ID列には2つの値のみを含める必要があります。テストセットのレベルで、テストサンプルとして使用する水準を選択します。
  3. (オプション)トレーニング/テスト分割のID列を保存するを選択してID列を保存します。

なし

なしが選択されている場合、追加の検証は実行されません。