重み付き回帰とは

重み付き回帰は、残差における均一な分散の最小二乗仮定に違反する(不等分散性とも呼ばれる)場合に使用可能な方法です。この方法では、適正な重みをつけることによって重み付き二乗残差の合計を最小化し、均一な分散(等分散性)の残差を生成します。

重要

省略した変数によって不等分散性が現れる場合、重み付き回帰は適切な解決策ではありません。

使用する重みを選択する方法

使用する適正な重みを判断するのは容易ではありません。理想的な重みは、誤差の分散の逆数です。しかし、この値は通常計算することができず、他の方法を使用する必要があります。次の方法をかわりに使用できます。
  • 分散が予測変数に比例する場合は、予測変数または二乗予測変数の逆数。試行錯誤により、うまくいく重み付け方法を判断します。
  • 理論、文献、以前の研究に基づく値

通常、分散が小さい観測値の重みは相対的に大きく、分散が大きい観測値の重みは相対的に小さくなります。

回帰モデルにより、さまざまな都市における年間の交通事故件数を予測するとします。人口が多いほど事故件数が増える傾向があるため、大都市の残差も大きくなる傾向があります。この問題を解決する1つの方法は、各都市の人口の逆数を重みとして使用することです。

重みは自由度に影響を与えない

1つ以上の観測値に0の重みを指定しない限り、重みの列を指定することで、自由度が影響を受けることはありません。観測値に0の重みを設定すると、その観測値は分析から削除されるので、自由度は減少します。

重みの列を指定すると、平方和とパラメータ推定値は次のような影響を受けます。
  • 平方和が重み付き平方和になります。
  • 重み付き平均が平方和の合計で使用されます。
  • 重み付き最小二乗判定基準がパラメータの推定に使用されます。

重み付き線形回帰の適合線プロットを作成する

次の手順で作成されたグラフには、回帰式、s、R二乗、調整済みR二乗は含まれませんが、統計 > 回帰 > 折れ線グラフで作成される適合線プロットには含まれます。ただし、この情報は出力され、グラフにコピー&ペーストができます。

応答がC1に、予測変数がC2に、重みがC3にあるとします。

  1. 統計 > 回帰 > 回帰 > 回帰モデルの適合を選択する
  2. 応答C1と入力します。連続予測変数C2と入力します。
  3. オプションをクリックします。
  4. 重みC3と入力します。OKをクリックします。
  5. 保存をクリックします。
  6. 適合値をクリックします。
  7. 各ダイアログボックスでOKをクリックします。
  8. グラフ > 散布図を選択します。
  9. 単純をクリックします。OKをクリックします。
  10. Y変数C1と入力します。
  11. X変数C2と入力します。OKをクリックします。
  12. 散布図を右クリックし、追加 > 計算されたラインを選択します。
  13. Y列に適合値の列(通常は「FITS1」と名前をつけます)を入力します。
  14. X列C2と入力します。OKをクリックします。

線の色とグラフのタイトルを編集する

線の色は変更できます。線を青色にするには、線をダブルクリックします。属性タブのラインカスタムを選択して、「カラー」ドロップダウンリストから青を選択します。OKをクリックします。

タイトルも変更できます。タイトルをダブルクリックします。フォントタブのテキストにタイトルを入力します。OKをクリックします。