2値ロジスティック回帰の検証 2値ロジスティックモデルの当てはめ方法を指定します

統計 > 回帰 > 2値ロジスティック回帰 > 2値ロジスティックモデルの適合 > 検証

予測分析モジュール > 2値ロジスティック回帰 > 検証

モデルをテストする検証法を選択します。通常、サンプルが小さい場合は、K分割交差検証法が適しています。サンプルが大きい場合は、トレーニングやテストに使用するケースの、ある割合を選択できます。

なし

この解析ではモデルは検証されません。

K分割交差検証

K分割交差検証を使用するには、次の手順を実行します。
  1. ドロップダウンリストからK分割交差検証を選択します。
  2. 次のいずれかを選択して、分割をランダムに割り当てるかID列を使用するかを指定します。
    • 各分割の行をランダムに割り当てる: 各分割に対して行をランダムに選択するには、このオプションを選択します。分割数を指定できます。ほとんどの場合、デフォルト値の10が良好に機能します。Kの値を小さくすると、より多くの偏りが生じる可能性があります。しかし、Kの値が大きいほど、変動性が大きくなる可能性があります。乱数生成器の初期値を設定することもできます。
    • ID列ごとに各分割の行を割り当てる: 各分割に含める行を選択するには、このオプションを選択します。ID列に、分割を識別する列を入力します。ID列に同じ値をもつ各行が、同じ分割になります。
    • (オプション)K分割交差検証のID列を保存するを選択してID列を保存します。

テストセットによる検証

データをトレーニングデータセットとテストデータセットに分割するには、以下のステップを実行します。
  1. ドロップダウンリストからテストセットによる検証を選択します。
  2. 行のある割合をランダムに選択するか、ID列を使用するかを指定するには、次のいずれかを選択します。
    • テストセットとして行のある割合をランダムに選択する: 検定データセットをランダムに選択するには、このオプションを選択します。テストデータセットで使用するデータの量を指定できます。ほとんどの場合、デフォルト値の0.3が良好に機能します。モデルを良好に評価するために、テストデータセットに十分なデータを含める必要があります。モデルの形式が不明な場合は、テストデータセットを大きくすると、より強力な検証が提供されます。また、モデルを良好に評価するために、テストデータセットに十分なデータを含める必要があります。通常、予測変数の数が多いモデルでは、より多くのトレーニングデータで推定する必要があります。
    • ID列でのトレーニング/テスト分割を定義する: テストサンプルに含める行を自分で選択するには、このオプションを選択します。ID列に、テストサンプルに使用する行を示す列を入力します。ID列には2つの値のみを含める必要があります。テストセットのレベルで、テスト サンプルとして使用する水準を選択します。
  3. (オプション)トレーニング/テスト分割のID列を保存するをチェックしてID列を保存します。