ステップワイズ回帰とは

ステップワイズ回帰は、予測変数の有用なサブセットを識別するために、モデル構築の探索段階で使用される自動化ツールです。この手順では、系統的に最も有意な変数を追加したり、各ステップで有意性が最も低い変数を削除したりします。

たとえば、住宅市場のコンサルティング会社が将来的な販売価格を予測する目的で、前年の住宅販売に関するデータを収集するとします。100以上の予測変数を使用すると、最も有意なモデルを見つけるのに相当の時間がかかります。Minitabのステップワイズ回帰機能では、最も有意なモデルとともに、R二乗、調整済みR二乗、予測されたR二乗、S、およびマロウズのCpが自動的に出力され、適切な最初のステップとなります。

共通のステップワイズ手順

  • 標準的なステップワイズ回帰では、ステップごとの必要に応じて、予測変数の追加と削除の両方を実行します。Minitabは、モデルに含まれていないすべての変数のp値が指定した[追加するためのα]値より大きくなったとき、およびモデルに含まれるすべての変数のp値が[削除するためのα]値以下になったときに停止します。
  • 前方選択は空のモデルで開始され、Minitabはステップごとに最も有意な項を追加します。Minitabは、モデルに含まれていないすべての変数のp値が指定された[追加するためのα]値より大きくなると停止します。
  • 後方削除はモデル内のすべての予測変数で開始され、Minitabはステップごとに有意性の最も低い変数を削除します。Minitabは、モデルに含まれるすべての変数のp値が指定された[削除するためのα]値以下になると停止します。

ステップワイズ回帰の問題

  • 2つの予測変数の相関が非常に強い場合は、どちらとも重要な変数であっても片方の変数のみがモデルに取り込まれます。
  • この手順は多くのモデルに適合するため、偶然というだけの理由でデータによく適合するモデルが選択されることがあります。
  • ステップワイズ回帰は、指定された予測変数の数の場合に可能な最高のR2値を持つモデルで常に停止するとは限りません。
  • 自動選択手法では、分析者の専門知識は考慮されません。したがって、選択されたモデルは実用的な観点からは最良ではない可能性があります。
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください