決定的スクリーニング計画の分析のモデル要約表

このトピックの内容

S
R二乗
R二乗（調整済み）
PRESS
R二乗（予測）
AICcとBIC
マローズ（Mallows）のCp

S

Sは、データ値と適合値の間の距離を表します。Sは応答の単位で測定されます。

解釈

Sを使い、モデルがどの程度良好に応答を表示するか判断します。Sは応答変数の単位で測定され、データ値と適合値がどの程度離れているかの標準偏差を表します。Sの値が小さければ小さいほど、モデルによる応答の記述が良好になります。ただし、Sの値が小さいだけでは、そのモデルが仮定を満たしているとは言い切れません。残差プロットを確認して仮定を検証する必要があります。

たとえば、ポテトチップ製造会社が、パッケージあたりに含まれる砕けたポテトチップの割合に影響する因子を調べるとします。モデルを有意な予測変数まで下げ、Sの計算値が1.79になったとします。この結果は、適合値を中心としたデータ点の標準偏差が1.79であることを示しています。モデルを比較している場合、1.79よりも低い値は良好な適合を示し、高い値は適合度が低いことが分かります。

R二乗

R²は、モデルで説明される応答の変動のパーセントです。値は1から残差平方和（モデルによって説明されない変動）の比を引いて全体平方和（モデルの変動の合計）まで計算されます。

解釈

適合線プロットを使用し、異なるR²値を図示することができます。最初のプロットは、応答における85.5%の変動を説明する単回帰モデルを図示しています。2つ目のプロットは、応答における22.6%の変動を説明するモデルを図示しています。モデルによって説明される変動が大きいほど、適合回帰直線の近くにデータ点がプロットされます。理論的には、モデルによって変動の100%を説明できる場合、適合値は必ず観測値と等しくなり、すべてのデータ点が適合回帰線上にプロットされます。しかし、R²値が100%であったとしても、モデルが必ずしも新しい観測値をうまく予測するとは限りません。

R²値を解釈する際は次の問題を考慮してください。

R²はモデルに新しい予測変数を追加すると必ず大きくなります。たとえば、最適な5予測変数モデルのR²は必ず、最適な4予測変数モデルと少なくとも同じ大きさになります。したがって、R²値は同じ大きさのモデルの比較に最も便利です。
サンプルサイズが小さい場合、応答と予測との間の関係の強さが正確に推定されません。より正確なR²が必要な場合、サンプルサイズを大きくする必要があります（40以上が一般的です）。
R²は、データに対するモデルの適合度を測る1つの測度に過ぎません。モデルのR²が大きくても残差プロットを確認してモデルが仮定を満たしているか検証する必要があります。

R二乗（調整済み）

調整済みR²はモデルで説明される応答の変動のパーセントで、観測値数と比較してモデル内の予測変数の数に応じて調整されます。調整されたR²は1から平均平方誤差（MSE）の比を引いて全体平均平方（MS Total）まで計算されます。

解釈

異なる数の予測変数を持つモデルを比較する場合は、調整済みR²を使用します。R²はモデルに予測変数を追加すると、それがモデルを改善しないとしても必ず大きくなります。調整済みR²値にはモデルに含まれる予測変数の数が組み入れられるため、正しいモデルの選択に役立ちます。

たとえば、ポテトチップ製造会社が、パッケージあたりに含まれる砕けたポテトチップの割合に影響する因子を調べるとします。前方ステップワイズによる方法で予測変数を追加したところ、以下の結果が得られたとします。

モデル	ポテトの割合	冷却率	調理温度	R²	調整済みR²
1	X			52%	51%
2	X	X		63%	62%
3	X	X	X	65%	62%

1つ目のモデルのR²は50%以上になります。2つ目のモデルでは冷却率がモデルに追加されました。調整済みR²は大きくなり、冷却率によりモデルが改善されることを示しています。調理温度が追加された3つ目のモデルでもR²は大きくなりますが、調整済みR²は大きくなりません。3番目のステップでは、調理温度がモデルに追加され、逸脱度R2は上昇しますが、調整済みR²は上昇しません。これらの結果から、調理温度はモデルを改善しないことがわかります。

PRESS

予測残差平方和（PRESS）とは、適合値と観測値の偏差を表す測度です。PRESSは二乗残差の和である残差平方和（SSE）と似ています。ただし、PRESSの残差計算方法は異なります。PRESSの計算式は、データセットからの各観測値の系統的な削除、回帰式の推定、削除した観測値をモデルがどの程度良好に予測するかの判断に使われるのと同じです。

解釈

PRESSを使用してモデルの予測能力を評価します。通常、PRESSの値が小さいほどモデルの予測能力は上がります。Minitabでは、通常より直感的に解釈できる予測R²を計算する場合にPRESSが使用されます。合わせることにより、これらの統計量によって過剰適合を回避することができます。過剰適合は、サンプルデータでは重要に見えても母集団には重要でない項を追加した場合に起こります。その結果モデルはサンプルデータに即してしまい、母集団の予測に適さなくなる可能性があります。

R二乗（予測）

予測R²は、データセットからの各観測値の系統的な削除、回帰式の推定、削除した観測値を、モデルがどの程度良好に予測するかの判断に使われるのと同じ計算式によって求められます。予測R²は0%～100%の間の値です（予測R²値に負値が算出される場合がありますが、Minitabでは0を表示します）。

解釈

予測R²を使用して、モデルが新しい観測値に対する応答をどの程度良好に予測するかを判断します。予測R²値が大きいモデルの予測能力は優れています。

R²よりも大幅に低い予測R²は、モデルの過剰適合を示している可能性があります。過剰適合は、母集団には重要でない項を追加した場合に起こります。そのモデルはサンプルデータに即してしまい、母集団の予測に適さなくなる可能性があります。

予測R²は、モデル計算に含まれていない観測値によって計算されるため、モデルを比較する場合は調整済みR²より便利です。

たとえば、財務コンサルティングの分析者が、将来の市況を予測するモデルを作成するとします。R²は87%であるため、このモデルは期待が持てるように見えます。しかしながら、予測R²はたった52%しかなく、これはモデルの過剰適合の可能性を示しています。

AICcとBIC

補正赤池情報量基準（AICc）とベイズ情報量規準（BIC）は、モデルの適合度と含まれる項の数を説明する、モデルの相対的な質を測る測度です。

解釈

異なるモデルを比較する際はAICcとBICを使用します。小さい値が好ましいと考えられます。ただし、予測変数セットに対して最小値を持つモデルは必ずしもデータに良好に適合しません。検定と残差プロットも使用して、データに対するモデルの適合度を評価してください。

AICcとBICは両方とも、モデルの尤度を評価し、モデルに項を追加したときにペナルティを適用します。このペナルティにより、モデルがサンプルデータに過剰適合する傾向を減少させます。こうした減少により、通常のモデルのパフォーマンスを改善できます。

一般的なガイドラインとして、パラメーター数がサンプルサイズよりも少ない場合、BICにおける各パラメーターの追加に対するペナルティはAICcよりも大きくなります。これらのケースでは、BICを最小化するモデルは、AICcを最小化するモデルよりも小さくなる傾向があります。

スクリーニング計画などのよくある一部のケースでは、一般的に、パラメーター数はサンプルサイズよりも多くなります。これらのケースでは、AICcを最小化するモデルは、BICを最小化するモデルよりも小さくなる傾向があります。たとえば、実行数が13の決定的スクリーニング計画では、AICcを最小化するモデルは、6個以上のパラメーターを持つ1組のモデル内ではBICを最小化するモデルよりも小さくなる傾向があります。

AICcとBICに関する詳細は、Burnham and Anderson（¹を参照してください。

マローズ（Mallows）のCp

マローズ（Mallows）のCpを使用すると、競合する複数の回帰モデルの間で選択ができるようになります。マローズのCp値は、完全モデルを予測変数のベストサブセットを持つモデルと比較します。これにより、モデル内の予測変数の数との重要なバランスを取ることができます。モデルに含まれる予測変数の数が多すぎる場合は相対的に精度が低くなり、少なすぎる場合は推測値に偏りが生じます。回帰モデルの比較にマローズのCp値を使用することは、最初から同じ予測変数の完全セットを使用した場合にのみ有効です。

解釈

マローズのCpの値が、予測変数の数に定数を加えた値に近い場合は、モデルが相対的に精度が高く、偏りが少ない推定値を導出することを示しています。

マローズのCpの値が、予測変数の数に定数を加えた値よりも大きい場合は、モデルが偏っており、データにあまり適合しないことを示しています。

¹ Burnham, K. P., & Anderson, D. R.（2004年）「Multimodel inference: Understanding AIC and BIC in model selection.」Sociological Methods & Research第33(2)巻、261～304ページ、doi:10.1177/0049124104268644