ベストサブセット回帰のすべての統計量を解釈する

ベストサブセット回帰で使用されるすべての統計量の定義と解釈について解説します。

Vars(分散)

分散は各モデルに含まれる予測変数の数を示します。デフォルトでは、予測変数の数ごとに、R2の値が最大の2つのモデルが選択されます。表の右側は、「X」で表記されるモデル内にある予測変数を表示します。
応答は熱流量 対 R二乗 日 (調整 R二乗 照 時 変数 R二乗 済み) (予測) MallowsのCp S 量 東 南 北 刻 1 72.1 71.0 66.9 38.5 12.328 X 1 39.4 37.1 26.3 112.7 18.154 X 2 85.9 84.8 81.4 9.1 8.9321 X X 2 82.0 80.6 74.2 17.8 10.076 X X 3 87.4 85.9 79.0 7.6 8.5978 X X X 3 86.5 84.9 81.4 9.7 8.9110 X X X 4 89.1 87.3 80.6 5.8 8.1698 X X X X 4 88.0 86.0 79.3 8.2 8.5550 X X X X 5 89.9 87.7 78.8 6.0 8.0390 X X X X X

R二乗

R2は、モデルで説明される応答の変動のパーセントです。値は1から残差平方和(モデルによって説明されない変動)の比を引いて全体平方和(モデルの変動の合計)まで計算されます。

解釈

R2を使い、データに対するモデルの適合度を判断します R2値が大きくなるほど、モデルのデータへの適合度は上がります。R2は常に0~100%の間の値になります。

適合線プロットを使用し、異なるR2値を図示することができます。最初のプロットは、応答における85.5%の変動を説明する単回帰モデルを図示しています。2つ目のプロットは、応答における22.6%の変動を説明するモデルを図示しています。モデルによって説明される変動が大きいほど、適合回帰直線の近くにデータ点がプロットされます。理論的には、モデルによって変動の100%を説明できる場合、適合値は必ず観測値と等しくなり、すべてのデータ点が適合回帰線上にプロットされます。しかし、R2値が100%であったとしても、モデルが必ずしも新しい観測値をうまく予測するとは限りません。
R2値を解釈する際は次の問題を考慮してください。
  • R2はモデルに新しい予測変数を追加すると必ず大きくなります。たとえば、最適な5予測変数モデルのR2は必ず、最適な4予測変数モデルと少なくとも同じ大きさになります。したがって、R2値は同じ大きさのモデルの比較に最も便利です。

  • サンプルサイズが小さい場合、応答と予測との間の関係の強さが正確に推定されません。たとえば、より正確なR2が必要な場合、サンプルサイズを大きくする必要があります(40以上が一般的です)。

  • 適合度統計量は、データに対するモデルの適合度を測る1つの測度に過ぎません。モデルに望ましい値がある場合でも、残差プロットを確認してモデルが仮定を満たしているかを検証する必要があります。

R二乗(調整済み)

調整済みR2はモデルで説明される応答の変動のパーセントで、観測値数と比較してモデル内の予測変数の数に応じて調整されます。調整されたR2は1から平均平方誤差(MSE)の比を引いて平均平方合計(MS Total)まで計算されます。

解釈

異なる数の予測変数を持つモデルを比較する場合は、調整済みR2を使用します。R2はモデルに予測変数を追加すると、それがモデルを改善しないとしても必ず大きくなります。調整済みR2値にはモデルに含まれる予測変数の数が組み入れられるため、正しいモデルの選択に役立ちます。

たとえば、ポテトチップ製造会社が、パッケージあたりに含まれる砕けたポテトチップの割合に影響する因子を調べるとします。前方ステップワイズによる方法で予測変数を追加して、以下の結果が得られたとします。
モデル ポテトの割合 冷却率 調理温度 R2 調整済みR2
1 X     52% 51%
2 X X   63% 62%
3 X X X 65% 62%

1つ目のモデルのR2は50%以上になります。2つ目のモデルでは冷却率がモデルに追加されました。調整済みR2は大きくなり、冷却率によりモデルが改善されることを示しています。調理温度が追加された3つ目のモデルでもR2は大きくなりますが、調整済みR2は大きくなりません。これらの結果から、調理温度はモデルを改善しないことがわかります。これらの結果から、調理温度はモデルを改善しないことがわかります。

PRESS

予測残差平方和(PRESS)とは、適合値と観測値の偏差を表す測度です。PRESSは二乗残差の和である残差平方和(SSE)と似ています。ただし、PRESSの残差計算方法は異なります。PRESSの計算式は、データセットからの各観測値の系統的な削除、回帰式の推定、削除した観測値をモデルがどの程度良好に予測するかの判断に使われるのと同じです。

解釈

PRESSを使用してモデルの予測能力を評価します。通常、PRESSの値が小さいほどモデルの予測能力は上がります。Minitabでは、通常より直感的に解釈できる予測R2を計算する場合にPRESSが使用されます。合わせることにより、これらの統計量によって過剰適合を回避することができます。過剰適合は、サンプルデータでは重要に見えても母集団には重要でない項を追加した場合に起こります。その結果モデルはサンプルデータに即してしまい、母集団の予測に適さなくなる可能性があります。

R二乗(予測)

予測R2は、データセットからの各観測値の系統的な削除、回帰式の推定、削除した観測値をモデルがどの程度良好に予測するかの判断に使われるのと同じ計算式によって求められます。予測R2は0%~100%の値です(予測R2値に負値が算出される場合がありますが、Minitabでは0を表示します)。

解釈

予測R2を使用して、モデルが新しい観測値に対する応答をどの程度良好に予測するかを判断します。 予測R2値が大きいモデルの予測能力は優れています。

R2よりも大幅に低い予測R2は、モデルの過剰適合を示している可能性があります。過剰適合は、母集団には重要でない項を追加した場合に起こります。そのモデルはサンプルデータに即してしまい、母集団の予測に適さなくなる可能性があります。

予測R2は、モデル計算に含まれていない観測値によって計算されるため、モデルを比較する場合は調整済みR2より便利です。

たとえば、財務コンサルティングの分析者が、将来の市況を予測するモデルを作成するとします。R2は87%であるため、このモデルは期待が持てるように見えます。しかしながら、予測R2はたった52%しかなく、これはモデルの過剰適合の可能性を示しています。

マローズ(Mallows)のCp

マローズ(Mallows)のCpを使用すると、競合する複数の回帰モデルの間で選択ができるようになります。マローズのCp値は、完全モデルを予測変数のベストサブセットを持つモデルと比較します。これにより、モデル内の予測変数の数との重要なバランスを取ることができます。モデルに含まれる予測変数の数が多すぎる場合は相対的に精度が低くなり、少なすぎる場合は推測値に偏りが生じます。回帰モデルの比較にマローズのCp値を使用することは、最初から同じ予測変数の完全セットを使用した場合にのみ有効です。

解釈

マローズのCpの値が、予測変数の数に定数を加えた値に近い場合は、モデルが相対的に精度が高く、偏りが少ない推定値を導出することを示しています。

マローズのCpの値が、予測変数の数に定数を加えた値よりも大きい場合は、モデルが偏っており、データにあまり適合しないことを示しています。

S

Sはデータ値と適合値間の距離の標準偏差を表します。Sは応答変数の単位で測定されます。

解釈

Sを使い、モデルがどの程度良好に応答を表示するか判断します。Sは応答変数の単位で測定され、データ値と適合値の間の距離を表します。Sの値が小さければ小さいほど、モデルによる応答の記述が良好になります。ただし、Sの値が小さいだけでは、そのモデルが仮定を満たしているとは言い切れません。残差プロットを確認して仮定を検証する必要があります。

たとえば、ポテトチップ製造会社が、パッケージあたりに含まれる砕けたポテトチップの割合に影響する因子を調べるとします。モデルを有意な予測変数まで下げ、Sの計算値が1.79になったとします。この結果は、適合値を中心としたデータ点の標準偏差が1.79であることを示しています。モデルを比較している場合、1.79よりも低い値は良好な適合を示し、高い値は適合度が低いことが分かります。

AICcとBIC

補正赤池情報量基準(AICc)とベイズ情報量規準(BIC)は、モデルの適合度と含まれる項の数を説明する、モデルの相対的な質を測る測度です。

解釈

異なるモデルを比較する際はAICcとBICを使用します。小さい値が好ましいと考えられます。ただし、予測変数セットに対して最小値を持つモデルは必ずしもデータに良好に適合しません。検定と残差プロットも使用して、データに対するモデルの適合度を評価してください。

AICcとBICは両方とも、モデルの尤度を評価し、モデルに項を追加したときにペナルティを適用します。このペナルティにより、モデルがサンプルデータに過剰適合する傾向を減少させます。こうした減少により、通常のモデルのパフォーマンスを改善できます。

一般的なガイドラインとして、パラメーター数がサンプルサイズよりも少ない場合、BICにおける各パラメーターの追加に対するペナルティはAICcよりも大きくなります。これらのケースでは、BICを最小化するモデルは、AICcを最小化するモデルよりも小さくなる傾向があります。

スクリーニング計画などのよくある一部のケースでは、一般的に、パラメーター数はサンプルサイズよりも多くなります。これらのケースでは、AICcを最小化するモデルは、BICを最小化するモデルよりも小さくなる傾向があります。たとえば、実行数が13の決定的スクリーニング計画では、AICcを最小化するモデルは、6個以上のパラメーターを持つ1組のモデル内ではBICを最小化するモデルよりも小さくなる傾向があります。

AICcとBICに関する詳細は、Burnham and Anderson(1を参照してください。

条件数

条件数は、モデルに含める項の間の多重共線性の指標となります。多重共線性とは、モデル内の一部の項が他の項と相関しているときに起こる状態です。モデルを比較したときに、条件数は小さいほど良好です。

解釈

条件数を使用して、異なる項を持つモデルを比較します。条件数が1の場合は、モデル項に相関がないことを示しています。値が大きいほど、多重共線性が高いことを表しています。

特定の条件数の結果がいくつかの条件によって変わる一方、100を上回る値は、通常調査の必要性を示します。モデル内の項に多重共線性がある場合、モデルの解釈は、項に相関のないモデルの解釈ほど単純ではありません。詳細は回帰での多重共線性を参照してください。

これらの結果では、モデルに項が1つしかない場合の条件数は1です(モデルに連続予測変数が1つある場合の条件数は常に1です)。条件数が100を上回るモデルはないので、予測変数間の多重共変性が結果に大きな影響を与える可能性は低いです。

ベストサブセット回帰:熱流量 対 対日照量, 東, 南, 北, 時刻

応答は熱流量 対 日 R二乗 (調 予測残差平方和 Mallows AICc(修正済み BIC(ベイズ 照 時 変数 R二乗 整済み) (PRESS) R二乗 (予測) のCp S 赤池情報量基準) 情報量基準) 条件番号 量 東 南 北 刻 1 72.1 71.0 4855.9 66.9 38.5 12.328 232.873 236.015 1.000 X 1 39.4 37.1 10822.6 26.3 112.7 18.154 255.321 258.463 1.000 X 2 85.9 84.8 2736.5 81.4 9.1 8.9321 215.798 219.600 1.807 X X 2 82.0 80.6 3786.4 74.2 17.8 10.076 222.788 226.590 5.344 X X 3 87.4 85.9 3089.7 79.0 7.6 8.5978 215.390 219.618 2.428 X X X 3 86.5 84.9 2725.9 81.4 9.7 8.9110 217.466 221.693 5.141 X X X 4 89.1 87.3 2847.2 80.6 5.8 8.1698 214.454 218.840 5.988 X X X X 4 88.0 86.0 3045.7 79.3 8.2 8.5550 217.127 221.512 20.427 X X X X 5 89.9 87.7 3109.9 78.8 6.0 8.0390 215.799 220.037 22.614 X X X X X
1 Burnham, K. P., & Anderson, D. R.(2004年)「Multimodel inference: Understanding AIC and BIC in model selection.」Sociological Methods & Research第33(2)巻、261~304ページ、doi:10.1177/0049124104268644
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください