と 2値ロジスティック回帰の検証 2値ロジスティックモデルの当てはめ方法を指定します

統計 > 回帰 > 2値ロジスティック回帰 > 2値ロジスティックモデルの適合 > 検証

予測分析モジュール > 2値ロジスティック回帰 > 検証

モデルをテストする検証法を選択します。通常、サンプルが小さい場合は、K分割交差検証法が適しています。サンプルが大きい場合は、トレーニングやテストに使用するケースの、ある割合を選択できます。

このトピックの内容

なし
K分割交差検証
テストセットによる検証

なし

この解析ではモデルは検証されません。

K分割交差検証

K分割交差検証を使用するには、次の手順を実行します。

ドロップダウンリストからK分割交差検証を選択します。
次のいずれかを選択して、分割をランダムに割り当てるかID列を使用するかを指定します。
- 各分割の行をランダムに割り当てる: 各分割に対して行をランダムに選択するには、このオプションを選択します。分割数を指定できます。ほとんどの場合、デフォルト値の10が良好に機能します。Kの値を小さくすると、より多くの偏りが生じる可能性があります。しかし、Kの値が大きいほど、変動性が大きくなる可能性があります。乱数生成器の初期値を設定することもできます。
- ID列ごとに各分割の行を割り当てる: 各分割に含める行を選択するには、このオプションを選択します。ID列に、分割を識別する列を入力します。ID列に同じ値をもつ各行が、同じ分割になります。
- （オプション）K分割交差検証のID列を保存するを選択してID列を保存します。

テストセットによる検証

データをトレーニングデータセットとテストデータセットに分割するには、以下のステップを実行します。

ドロップダウンリストからテストセットによる検証を選択します。
行のある割合をランダムに選択するか、ID列を使用するかを指定するには、次のいずれかを選択します。
- テストセットとして行のある割合をランダムに選択する: 検定データセットをランダムに選択するには、このオプションを選択します。テストデータセットで使用するデータの量を指定できます。ほとんどの場合、デフォルト値の0.3が良好に機能します。モデルを良好に評価するために、テストデータセットに十分なデータを含める必要があります。モデルの形式が不明な場合は、テストデータセットを大きくすると、より強力な検証が提供されます。また、モデルを良好に評価するために、テストデータセットに十分なデータを含める必要があります。通常、予測変数の数が多いモデルでは、より多くのトレーニングデータで推定する必要があります。
- ID列でのトレーニング/テスト分割を定義する: テストサンプルに含める行を自分で選択するには、このオプションを選択します。ID列に、テストサンプルに使用する行を示す列を入力します。ID列には2つの値のみを含める必要があります。テストセットのレベルで、テストサンプルとして使用する水準を選択します。
（オプション）トレーニング/テスト分割のID列を保存するをチェックしてID列を保存します。