の検証法の指定 回帰モデルの適合

統計 > 回帰 > 回帰 > 回帰モデルの適合 > 検証

モデルをテストする検証法を選択します。通常、サンプルが小さい場合は、K分割交差検証法が適しています。サンプルが大きい場合は、トレーニングやテストに使用するケースの、ある割合を選択できます。

K分割交差検証

K分割交差検証を使用するには、次の手順を実行します。

  1. ドロップダウンリストからK分割交差検証を選択します。
  2. 次のいずれかを選択して、分割をランダムに割り当てるか、ID 列で割り当てるかを指定します。
    • 各分割の行をランダムに割り当てる:各分割に対して行をランダムに選択するには、このオプションを選択します。分割数を指定できます。ほとんどの場合、デフォルト値の10が良好に機能します。Kの値を小さくすると、より多くの偏りが生じる可能性があります。しかし、Kの値が大きいほど、変動性が大きくなる可能性があります。乱数生成器の初期値を設定することもできます。
    • ID列ごとに各分割の行を割り当てる:各分割に含める行を選択するには、このオプションを選択します。ID列に、分割を識別する列を入力します。ID列に同じ値を持つ各行が、同じ分割になります。
  3. (オプション) K分割交差検証のID列を保存するをチェックして、ID 列を保存します。

テストセットによる検証

データをトレーニングデータセットとテストデータセットに分割するには、以下のステップを実行します。

  1. ドロップダウンリストからテストセットによる検証を選択します。
  2. 次のいずれかを選択して、行のある割合をランダムに選択するか、ID列で選択するかを指定します。
    • テストセットとして行のある割合をランダムに選択する:テストデータセットをランダムに選択するには、このオプションを選択します。テストデータセットで使用するデータの量を指定できます。ほとんどの場合、デフォルト値の0.3が良好に機能します。モデルを良好に評価するために、テストデータセットに十分なデータを含める必要があります。モデルの形式が不明な場合は、テストデータセットを大きくすると、より強力な検証が提供されます。また、モデルを良好に評価するために、テストデータセットに十分なデータを含める必要があります。通常、より多くの予測変数をもつモデルでは、推定のためにより多くのトレーニングデータを必要とします。
    • ID列でのトレーニング/テスト分割を定義する:テストサンプルに含める行を自分で選択するには、このオプションを選択します。ID列に、テストサンプルに使用する行を示す列を入力します。ID列には2つの値のみを含める必要があります。テストセットの水準で、テストサンプルとして使用する水準を選択します。
  3. (オプション) トレーニング/テスト分割のID列を保存する をチェックして、ID 列を保存します。

なし

なし が選択されている場合、追加の検証は実行されません。
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください