ベストモデルの検出(連続応答) の検証法の指定

予測分析モジュール > 自動機械と学習 > ベストモデルの検出(連続応答) > 検証

最適なモデルのタイプを決定する検証方法を選択します。通常、サンプルが小さい場合は、K分割交差検証法が適しています。サンプルが大きい場合は、ある割合のトレーニングに使用するケースや、テストに使用するケースを選択できます。

Minitabで表示される選択は、データ・セットのサイズによって異なります。選択はサブダイアログの選択と結合 項... され、厳しさと計算速度のバランスをとる解析が提供されます。
n < 1,500
サブダイアログの検証メソッド 検証...K分割交差検証です。単位数は5です。回帰モデル選択法項... サブダイアログには、 ステップワイズです。
1,500 ≤ N < 2,000
サブダイアログの検証メソッド 検証...K分割交差検証です。単位数は5です。 回帰モデル選択法項... サブダイアログには、 検証のある前方選択です。
2,000, ..., ni
サブダイアログの検証メソッド 検証...テストセットによる検証です。テスト セットのデータの比率は 0.3 です。回帰モデル選択法項... サブダイアログには、 検証のある前方選択です。

K分割交差検証

K分割交差検証法を使用してテストサンプルを検証するには、次のステップを実行します。

  1. ドロップダウンリストからK分割交差検証を選択します。
  2. 検査者の数を指定します。ほとんどの場合、デフォルト値の5が良好に機能します。どちらの場合も分割数が多いほど、特に行数の少ないデータセットでは、より信頼性の高い予測モデルを選択する機会が増えますが、計算時間が大幅に長くなる可能性があります。数値を大きくすると、計算時間が大幅に長くなる可能性があります。
  3. (オプション)K分割交差検証のID列を保存するを選択してID列を保存します。

テストセットによる検証

トレーニングとテストに使用するデータの割合を指定するには、次のステップを実行します。多くの場合、データの70%がトレーニングに使用され、30%がテストに使用されます。

  1. ドロップダウンリストからテストセットによる検証を選択します。
  2. テスト セットのデータの割合を指定します。ほとんどの場合、デフォルト値の0.3が良好に機能します。より大きなデータセットの場合は、テストに使用するデータの割合を増やす必要がある場合があります。乱数生成器の初期値を設定することもできます。異なる分析実行で同じ基準を入力すると、テストセットへの行の割当は同じです。
  3. (オプション)トレーニング/テスト分割のID列を保存するを選択してID列を保存します。
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください