回帰モデルの適合のステップワイズを求める方法と計算式

目的の方法または計算式を選択してください。

ステップワイズ法

F検定に基づき、現在のモデルに対し予測変数の追加または削除を行い、変数の選択を実行します。ステップワイズは、前方選択と後方削除の組み合わせです。初期のモデルですべての自由度を使用する場合には、ステップワイズ選択は進められません。

取り除く変数

Minitabは、モデルの各変数に対してF統計量とp値を計算します。モデルにj個の変数がある場合、xr変数値に対するFは以下の計算式になります。

表記

用語説明
残差平方和(jXr) xrを含まないモデルに対する誤差平方和
残差平方和 j xrを含むモデルに対する誤差平方和
平均平方誤差 j xr を含むモデルに対する平均平方誤差

いずれかの変数に対するp値が変数削除時のαで指定した値より大きい場合、Minitabは最大のp値を持つ変数をモデルから取り除き、回帰式を計算し、結果を表示して次のステップを開始します。

追加する変数

Minitabが変数を取り除けない場合は、変数を追加しようとします。Minitabは、モデルにない各変数に対してF統計量とp値を計算します。モデルにj個の変数がある場合、xa変数値に対するFは以下の計算式になります。

表記

用語説明
残差平方和 j xa前の誤差平方和がモデルに追加されます。
残差平方和(j + Xa) xa後の誤差平方和がモデルに追加されます。
変数Xaの自由度
平均平方誤差(j + Xa) xa後の平均平方誤差がモデルに追加されます。

いずれかの変数に対するF統計量に対応するp値が変数追加時のαで指定した値より小さい場合、Minitabは最小のp値を持つ変数をモデルに追加し、回帰式を計算し、結果を表示して新しいステップに移行します。これ以上変数を追加または削除できない場合は、ステップワイズの手順は終了します。

前方選択手順

モデルにどの項を維持するかを判断する方法です。前方選択は、ステップワイズと同じ手順でモデルに予測変数を追加します。一度追加した予測変数は、削除されません。デフォルトでは、モデルに追加しようとする候補の変数に変数追加時のαで指定した値よりも小さなp値を持つものがなくなると、前方選択手順は終了します。

後方削除手順

モデルにどの変数を維持するかを判断する方法です。後方削除は、全ての項を含むモデルからスタートし、ステップワイズ手順と同じ方法で1つずつ項を削除していきます。一度取り除いた予測変数は、再度モデルに入れることはできません。デフォルトでは、モデルに含まれる変数に変数削除時のαで指定した値よりも大きなp値を持つものがなくなると、後方削除手順は終了します。初期のモデルですべての自由度を使用する場合には、後方削除は進められません。

前方情報基準法

モデルにどの変数を維持するかを判断する方法です。前方情報基準法では、各ステップのモデルに最小のp値を持つ項を追加します。分析の設定で非階層の項を考慮することが許可されているものの、各モデルの階層化が必須な場合、追加する項はステップ1のモデルに入力できます。Minitabではステップごとの情報基準を計算します。選択された情報基準(AICcかBICのいずれか)の最小値を持つモデルの分析結果が表示されます。ほとんどの場合、手順は、以下の条件の一つが生じるまで、続きます。
  • この手順では、8つの連続したステップの基準の改善は見つかりません。
  • 手順は完全なモデルに適合します。
  • 手順は誤差自由度が1つあるモデルに適合します。
各ステップで階層モデルを要求し、一度に1つの項しか入力できないように手順を指定した場合、手順は、完全なモデルに適合するか、または誤差自由度が1つあるモデルに適合するまで、続きます。選択された情報基準(AICcかBICのいずれか)の最小値を持つモデルの分析結果が表示されます。

検証のある前方選択

検証のある前方選択の手順は、検証法によって異なります。

テストデータセット

検定データセットを使用する場合、手順は前方選択に似ています。各ステップで、最小のp値をもつ項がモデルに追加されます。各ステップの最後に、検定R2値が計算されます。前方選択手順の最後に、最大のテストの R2値をもつモデルが最終モデルになります。

この手順では、次のいずれかの条件が発生するまで項が追加されます。
  • 手順では、8つの連続ステップの基準値が改善されません。
  • 手順は完全なモデルに適合します。
  • 手順は誤差自由度が1つあるモデルに適合します。

K分割交差検証

交差検証では、手順は各分割で前方選択を繰り返します。前方選択は、誤差の平方和を改善することなく、16ステップまで1分割で継続します。残りの各分割について、手順が次の数値の最小値に達するまで、前方選択が続行されます。
  • 直前の分割からのステップ数
  • 誤差の平方和を改善せずに行われた16ステップ
  • 完全モデルを適合するステップ数
  • 誤差の自由度を1つ残すモデルに適合するステップ数

各分割の前方選択手順が完了すると、各分割の選択手順にあるステップごとに、全体のk分割ステップワイズR2値が計算されます。最大k分割ステップワイズR2値を持つステップは、最終的な前方向選択手順から選択したモデルのステップになります。

最後に、完全なデータセットに対して前方向選択が実行されます。Minitabでは、ステップでのモデルの回帰結果と、k倍ステップワイズ手順の最大k倍ステップワイズR2値が表示されます。モデル選択詳細の表と、k分割ステップワイズR2対モデル選択ステップのグラフは、回帰結果のステップを過ぎて8ステップ継続します。