ステップワイズは、項の有用なサブセットを識別するために、項を削除したりモデルに追加したりします。ステップワイズ手順を選択した場合、モデルダイアログボックスで指定する項が最終モデルの候補になります。詳細については、ステップワイズ回帰とベストサブセット回帰の使用を参照してください。
交差検証では、手順は各分割で前方選択を繰り返します。この手順では、各ステップですべての分割を評価し、最適なK分割ステップワイズのR2値のステップを識別します。手順の最後の部分では、データセット全体に対して前方選択を実行し、分割の選択から最適なステップで停止します。
どちらの種類の検証でも、前方情報基準法と同じ条件で手順が停止します。
最終モデルに含まれる項は、モデルの階層の制限によって異なる場合があります。詳細については、以下の階層に関するトピックを参照してください。
前方選択で使用する情報基準を指定します。
AICcとBICは両方とも、モデルの尤度を評価し、モデルに項を追加したときにペナルティを適用します。このペナルティにより、モデルがサンプルデータに過剰適合する傾向を減少させます。こうした減少により、通常のモデルのパフォーマンスを改善できます。
一般的なガイドラインとして、パラメーター数がサンプルサイズよりも少ない場合、BICにおける各パラメーターの追加に対するペナルティはAICcよりも大きくなります。これらのケースでは、BICを最小化するモデルは、AICcを最小化するモデルよりも小さくなる傾向があります。
スクリーニング計画などのよくある一部のケースでは、一般的に、パラメーター数はサンプルサイズよりも多くなります。これらのケースでは、AICcを最小化するモデルは、BICを最小化するモデルよりも小さくなる傾向があります。たとえば、実行数が13の決定的スクリーニング計画では、AICcを最小化するモデルは、6個以上のパラメーターを持つ1組のモデル内ではBICを最小化するモデルよりも小さくなる傾向があります。
AICcとBICに関する詳細は、Burnham and Anderson(1を参照してください。
検証の設定は、 検証サブダイアログボックスにも表示されます。設定を変更すると、両方の箇所で設定が自動的に更新されます。
検証のある前方選択を選択する場合、モデルをテストする検証法を選びます。通常、サンプルが小さい場合は、K分割公差検証法が適しています。サンプルが大きい場合は、データをトレーニングデータセットとテストデータセットに分割できます。
次の手順を実行して、K分割交差検証を使用します。
データをトレーニングデータセットとテストデータセットに分割するには、以下のステップを実行します。
ステップワイズの手順中に、どのようにモデルの階層を組み込むかを決めることができます。モデルダイアログボックスに非階層モデルを指定した場合、階層ボタンは無効になります。
階層モデルでは、高次の項を構成するすべての低次の項もモデルに組み込まれています。たとえば、交互作用項A*B*Cを含むモデルがA、B、C、A*B、A*C、B*Cを含む場合、このモデルは階層的です。
モデルは非階層になることもあります。一般的に、低次項が有意でなければ、対象分野の知識から含める方が良いと考えられる場合を除き、その低次項を削除できます。項が多すぎるモデルは、相対的に精度が下がる可能性があり、新しい観測値の予測能力を低下させることがあります。
検証のある前方選択を選択すると、トレーニングのプロットと、前方選択の各ステップの検証R2値を表示します。通常、このプロットを使用して、より単純なモデルに類似した検証値があるかどうかを判断します。