ベストモデルの検出(2値応答) の検証法の指定

予測分析モジュール > 自動機械と学習 > ベストモデルの検出(2値応答) > 検証

最適なモデルのタイプを決定する検証方法を選択します。通常、サンプルが小さい場合は、K分割交差検証法が適しています。サンプルが大きい場合は、ある割合のトレーニングに使用するケースや、テストに使用するケースを選択できます。

Minitabで表示される選択は、データ・セットのサイズによって異なります。選択はサブダイアログの選択と結合項され、厳しさと計算速度のバランスをとる解析が提供されます。

N < 1,000: サブダイアログの検証メソッド検証は K分割交差検証です。単位数は5です。ロジスティック回帰モデル選択方法項サブダイアログには、ステップワイズです。
1,000 ≤ N < 1,500: サブダイアログの検証メソッド検証は K分割交差検証です。単位数は3です。ロジスティック回帰モデル選択方法項サブダイアログには、ステップワイズです。
1,500 ≤ N: サブダイアログの検証メソッド検証はテストセットによる検証です。テストセットのデータの比率は 0.3 です。ロジスティック回帰モデル選択方法項サブダイアログには、検証のある前方選択テストセットを使用するが、です。

K分割交差検証

K分割交差検証法を使用してテストサンプルを検証するには、次のステップを実行します。

ドロップダウンリストからK分割交差検証を選択します。
検査者の数を指定します。ほとんどの場合、デフォルト値の0.3が良好に機能します。どちらの場合も分割数が多いほど、特に行数の少ないデータセットでは、より信頼性の高い予測モデルを選択する機会が増えますが、計算時間が大幅に長くなる可能性があります。数値を大きくすると、計算時間が大幅に長くなる可能性があります。
（オプション）K分割交差検証のID列を保存するを選択してID列を保存します。

トレーニングとテストに使用するデータの割合を指定するには、次のステップを実行します。多くの場合、データの70%がトレーニングに使用され、30%がテストに使用されます。

ドロップダウンリストからテストセットによる検証を選択します。
テストセットのデータの割合を指定します。ほとんどの場合、デフォルト値の0.3が良好に機能します。より大きなデータセットの場合は、テストに使用するデータの割合を増やす必要がある場合があります。乱数生成器の初期値を設定することもできます。異なる分析実行で同じ基準を入力すると、テストセットへの行の割当は同じです。
（オプション）トレーニング/テスト分割のID列を保存するを選択してID列を保存します。