回帰モデルの適合線形回帰の検証 方法を指定します

統計 > 回帰 > 回帰 > 回帰モデルの適合 > 検証

予測分析モジュール > 線形回帰 > 検証

モデルをテストする検証法を選択します。通常、サンプルが小さい場合は、K分割交差検証法が適しています。サンプルが大きい場合は、トレーニングやテストに使用するケースの、ある割合を選択できます。

K分割交差検証

K分割交差検証を使用するには、次の手順を実行します。

  1. ドロップダウンリストからK分割交差検証を選択します。
  2. 次のいずれかを選択して、分割をランダムに割り当てるかID列を使用するかを指定します。
    • 各分割の行をランダムに割り当てる: 各分割に対して行をランダムに選択するには、このオプションを選択します。分割数を指定できます。ほとんどの場合、デフォルト値の10が良好に機能します。Kの値を小さくすると、より多くの偏りが生じる可能性があります。しかし、Kの値が大きいほど、変動性が大きくなる可能性があります。乱数生成器の初期値を設定することもできます。
    • ID列ごとに各分割の行を割り当てる: 各分割に含める行を選択するには、このオプションを選択します。ID列に、分割を識別する列を入力します。ID列に同じ値をもつ各行が、同じ分割になります。
  3. (オプション)K分割交差検証のID列を保存するをチェックしてID列を保存します。

テストセットによる検証

データをトレーニングデータセットとテストデータセットに分割するには、以下のステップを実行します。

  1. ドロップダウンリストからテストセットによる検証を選択します。
  2. 行のある割合をランダムに選択するか、ID列を使用するかを指定するには、次のいずれかを選択します。
    • テストセットとして行のある割合をランダムに選択する: 検定データセットをランダムに選択するには、このオプションを選択します。テストデータセットで使用するデータの量を指定できます。ほとんどの場合、デフォルト値の0.3が良好に機能します。モデルを良好に評価するために、テストデータセットに十分なデータを含める必要があります。モデルの形式が不明な場合は、テストデータセットを大きくすると、より強力な検証が提供されます。また、モデルを良好に評価するために、テストデータセットに十分なデータを含める必要があります。通常、予測変数の数が多いモデルでは、より多くのトレーニングデータで推定する必要があります。
    • ID列でのトレーニング/テスト分割を定義する: テストサンプルに含める行を自分で選択するには、このオプションを選択します。ID列に、テストサンプルに使用する行を示す列を入力します。ID列には2つの値のみを含める必要があります。テストセットのレベルで、テスト サンプルとして使用する水準を選択します。
  3. (オプション)トレーニング/テスト分割のID列を保存するをチェックしてID列を保存します。

なし

なし が選択されている場合、追加の検証は実行されません。