混合効果モデルの当てはめのモデル要約表

モデル要約表のすべての統計量の定義と解釈について解説します。

S

Sは誤差項の推定標準偏差です。Sの値が小さいほど、条件付き適合式により、選択した因子設定で応答がより適切に算出されます。ただし、S値だけではモデルの適合性を完全に表すことはできません。他の表や残差プロットの主要な結果も調査してください。

R二乗

R2は、モデルで説明される応答の変動のパーセントです。値は1から残差平方和(モデルによって説明されない変動)の比を引いて全体平方和(モデルの変動の合計)まで計算されます。

解釈

R2を使い、データに対するモデルの適合度を判断します R2値が高いほど、より多くの応答値の変動がモデルによって説明されます。R2は常に0~100%の間の値になります。

R2値を解釈する際は次の問題を考慮してください。
  • モデルの共分散構造が同じであると仮定すると、R2の値は固定因子または共変量を追加すると大きくなります。したがって、R2値は同じ大きさのモデルの比較に最も便利です。

  • サンプルサイズが小さい場合、応答と予測との間の関係の強さが正確に推定されません。たとえば、より正確なR2が必要な場合、サンプルサイズを大きくする必要があります(40以上が一般的です)。

  • 適合度統計量は、データに対するモデルの適合度を測る1つの測度に過ぎません。モデルに望ましい値がある場合でも、残差プロットを確認してモデルが仮定を満たしているかを検証する必要があります。

R二乗(調整済み)

同じ共分散構造を持ちながら固定因子と共変量の数が異なるモデルを比較したい場合は調整済みR2を使用します。モデルの共分散構造が同じであると仮定すると、R2の値は固定因子または共変量を追加すると大きくなります。調整済みR2値にはモデルに含まれる固定因子や共変量が組み入れられるため、正しいモデルの選択に役立ちます。

AICcとBIC

補正赤池情報量基準(AICc)とベイズ情報量規準(BIC)は、モデルの適合度と含まれる項の数を説明する、モデルの相対的な質を測る測度です。

解釈

異なるモデルを比較する際はAICcとBICを使用します。小さい値が好ましいと考えられます。ただし、予測変数セットに対して最小値を持つモデルは必ずしもデータに良好に適合しません。検定と残差プロットも使用して、データに対するモデルの適合度を評価してください。

AICcとBICは両方とも、モデルの尤度を評価し、モデルに項を追加したときにペナルティを適用します。このペナルティにより、モデルがサンプルデータに過剰適合する傾向を減少させます。こうした減少により、通常のモデルのパフォーマンスを改善できます。

一般的なガイドラインとして、パラメーター数がサンプルサイズよりも少ない場合、BICにおける各パラメーターの追加に対するペナルティはAICcよりも大きくなります。これらのケースでは、BICを最小化するモデルは、AICcを最小化するモデルよりも小さくなる傾向があります。

スクリーニング計画などのよくある一部のケースでは、一般的に、パラメーター数はサンプルサイズよりも多くなります。これらのケースでは、AICcを最小化するモデルは、BICを最小化するモデルよりも小さくなる傾向があります。たとえば、実行数が13の決定的スクリーニング計画では、AICcを最小化するモデルは、6個以上のパラメーターを持つ1組のモデル内ではBICを最小化するモデルよりも小さくなる傾向があります。

AICcとBICに関する詳細は、Burnham and Anderson(1を参照してください。

1 Burnham, K. P., & Anderson, D. R.(2004年)「Multimodel inference: Understanding AIC and BIC in model selection.」Sociological Methods & Research第33(2)巻、261~304ページ、doi:10.1177/0049124104268644