ベストモデルの検出(2値応答) の検証法の指定

予測分析モジュール > 自動機械と学習 > ベストモデルの検出(2値応答) > 検証

最適なモデルのタイプを決定する検証方法を選択します。通常、サンプルが小さい場合は、K分割交差検証法が適しています。サンプルが大きい場合は、ある割合のトレーニングに使用するケースや、テストに使用するケースを選択できます。

Minitabで表示される選択は、データ・セットのサイズによって異なります。選択はサブダイアログの選択と結合 され、厳しさと計算速度のバランスをとる解析が提供されます。
N < 1,000
サブダイアログの検証メソッド 検証K分割交差検証です。単位数は5です。 ロジスティック回帰モデル選択方法 サブダイアログには、 ステップワイズです。
1,000 ≤ N < 1,500
サブダイアログの検証メソッド 検証K分割交差検証です。単位数は3です。 ロジスティック回帰モデル選択方法 サブダイアログには、 ステップワイズです。
1,500 ≤ N
サブダイアログの検証メソッド 検証テストセットによる検証です。テスト セットのデータの比率は 0.3 です。 ロジスティック回帰モデル選択方法 サブダイアログには、 検証のある前方選択テストセットを使用する が、 です。

K分割交差検証

K分割交差検証法を使用してテストサンプルを検証するには、次のステップを実行します。

  1. ドロップダウンリストからK分割交差検証を選択します。
  2. 検査者の数を指定します。ほとんどの場合、デフォルト値の0.3が良好に機能します。どちらの場合も分割数が多いほど、特に行数の少ないデータセットでは、より信頼性の高い予測モデルを選択する機会が増えますが、計算時間が大幅に長くなる可能性があります。数値を大きくすると、計算時間が大幅に長くなる可能性があります。
  3. (オプション)K分割交差検証のID列を保存するを選択してID列を保存します。

テストセットによる検証

トレーニングとテストに使用するデータの割合を指定するには、次のステップを実行します。多くの場合、データの70%がトレーニングに使用され、30%がテストに使用されます。

  1. ドロップダウンリストからテストセットによる検証を選択します。
  2. テスト セットのデータの割合を指定します。ほとんどの場合、デフォルト値の0.3が良好に機能します。より大きなデータセットの場合は、テストに使用するデータの割合を増やす必要がある場合があります。乱数生成器の初期値を設定することもできます。異なる分析実行で同じ基準を入力すると、テストセットへの行の割当は同じです。
  3. (オプション)トレーニング/テスト分割のID列を保存するを選択してID列を保存します。