混合効果モデルの当てはめ

ある研究者がランダムに選択した4つの畑における6品種のアルファルファの生産高を分析します。各畑の各品種の収量が記録されました。

研究者は、アルファルファの品種が平均収穫量に影響するかどうかを調べようとしています。データを収集できる対象の畑は4つあります。しかし、研究者は実験対象外の畑におけるアルファルファの生長をモデル化できるようにしたいと考えています。このため、研究者はアルファルファの生育地を変量因子にしました。研究者は混合効果モデルを使用して固定効果とランダム効果を同時に評価します。

  1. サンプルデータを開くアルファルファ.MTW#.
  2. 統計 > 分散分析 > 混合効果モデル > 混合効果モデルの適合を選択します。
  3. 応答生産高を入力します。
  4. 変量因子(必須)を入力します。
  5. 固定因子品種を入力します。
  6. グラフをクリックします。
  7. プロットの残差で、 条件付き、標準化を選択します。
  8. 残差プロットで、 一覧表示を選択します。
  9. 各ダイアログでOKをクリックします。

結果を解釈する

分散成分表において、「畑」のp値は0.124です。仮説検定では、分散成分が0と異なるという証拠は示されません。誤差の分散成分のp値は0.003です。p値は有意水準0.05よりも小さいため、研究者は誤差の分散成分が0ではないと結論付けることができます。

固定因子項「品種」のおよそ0のp値は、少なくとも1品種のアルファルファが収穫量に与える影響が、他の5品種と有意に異なることを示しています。

主効果の係数は各水準毎の平均と全体平均の差を表します。たとえば、「品種1」の収穫量は全体平均よりおよそ0.385単位大きくなっています。この係数に対するおよそ0のp値は、「品種1」が収穫量に与える影響が「品種」項の他の水準効果と有意に異なることを示しています。どの水準効果が統計的に同じで、どの水準効果が統計的に異なるかを判断するために、研究者は項の多重比較分析を行うことにしました。

R2値は、モデルによって92%の収穫量の変動が説明されることを示しています。R二乗(調整済み)の値もおよそ90.2%と高くなっています。研究者はこの値を使用して、予測変数の数が異なるモデルを比較します。

観測値1と5の標準化残差は2より大きいため、異常な観測値です。研究者はデータを調査して、これらの観測値の応答値が正しいことを確認します。

正規確率プロットの残差はほぼ直線上に分布し、残差対適合値プロット上では0の周囲にランダムに散在しているように見えます。

方法

分散推定制約型最尤法
固定効果のDFKenward-Roger

因子情報

因子タイプ水準
ランダム41, 2, 3, 4
品種固定61, 2, 3, 4, 5, 6

分散成分

要因分散合計の%標準偏差の分散Z-値p値
0.07791972.93%0.0675801.1529960.124
誤差0.02892427.07%0.0105622.7386130.003
合計0.106843       
-2対数尤度 = 7.736012

固定効果の検定

DF 分子DF 分母F値p値
品種5.0015.0026.290.000

モデル要約

SR二乗R二乗 (調整済み)AICc(修正済み
赤池情報量基準)
BIC(ベイズ
情報量基準)
0.17007192.33%90.20%12.5413.52

係数

係数係数の標準誤差自由度t値p値
定数3.0945830.1438223.0021.5166920.000
品種         
  10.3854170.07762615.004.9650160.000
  20.1454170.07762615.001.8732870.081
  30.1079170.07762615.001.3902050.185
  4-0.3195830.07762615.00-4.1169380.001
  50.3954170.07762615.005.0938380.000

異常な観測値の周辺適合値と診断

観測値生産高適合値残差標準化残差
14.1000003.4800000.6200002.190221R
54.2200003.4900000.7300002.578808R
R  大きな残差

異常な観測値の条件付き適合値と診断

観測値生産高適合値残差標準化残差
54.2200003.8953390.3246612.400733R
R  大きな残差