混合効果モデルの当てはめ用の予測のすべての統計量

分析の予測で使用される統計量の定義と解釈について解説します。

条件付き適合式と周辺適合式

固定因子の異なる水準と共変量の異なる値での応答の母平均を推定する場合は、周辺適合式を使用します。周辺適合式では、変量因子の項の平均がゼロであることを前提とします。

固定因子と変量因子の特定の水準における応答の条件付き平均を計算する場合は、条件付き適合式を使用します。条件付きとは、与えられた変量因子の水準の条件に依るということを表します。

混合効果モデルには因子が含まれるため、適合式はモデルに含まれる因子水準のすべての組み合わせの表に表示されます。

設定

Minitabは適合式と変数設定を使用して、適合値を計算します。変数設定が、モデルの推定に使用するデータと比較して異常な場合、予測の下に警告が表示されます。

変数設定表を使い、目的の分析が行われたかどうかを検証してください。

適合値(Fit)

条件付き適合値は、データセットで与えられる固定および変量因子設定の両方における平均応答値の推定値です。条件付き適合値は、条件付き適合式により算出されます。

周辺適合値は、さまざまな固定因子水準における平均応答値を表します。周辺適合値は、周辺適合式により算出されます。

適合値の標準誤差(SE Fit)

適合値の標準誤差(SE Fit)は、特定の変数設定について推定される平均応答の変動を推定します。平均応答の信頼区間の計算には、適合値の標準誤差が使用されます。標準誤差は常に正数です。

信頼区間の自由度

信頼区間(CI)の自由度(DF)は、平均応答の信頼区間を推定するデータの情報量を表します。

解釈

自由度を使用して、異なる条件付き平均と周辺平均に利用できる情報量を比較します。一般に、自由度が多いほど、平均の信頼区間は自由度が少ない場合よりも狭くなります。平均の標準誤差には差があるので、自由度が多い平均の信頼区間は、自由度が少ない平均の信頼区間より狭くある必要はありません。

信頼区間(CI)

信頼区間(Cl)は、対応する条件付き平均応答と周辺平均応答が含まれている可能性のある値の範囲です。

データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。

信頼区間は、次の2つの部分で構成されています。

解釈

信頼区間を使用して、条件付き平均応答と周辺平均応答が特定の値と比較して統計的に大きいか同等か、あるいは小さいかを評価します。また、対応する未知の条件付き平均応答と周辺平均応答が含まれる可能性のある値の範囲を特定することもできます。

予測区間の自由度(DF)

予測区間(PI)の自由度(DF)は、対応する予測区間を推定するためのデータの情報量を表します。

予測区間(PI)

予測区間は、変数設定の選択された組み合わせに関する1つの将来の応答が含まれる可能性のある範囲です。同じ変数設定で別のデータ点を収集した場合、そのデータ点は予測区間に入っている可能性が高いといえます。予測区間が狭いほど、その予測の精度が高いことを示しています。

解釈

予測区間を使用して予測の精度を評価します。予測区間から、結果の実質的な有意性を評価できます。予測区間が許容範囲を超える場合は、予測は要求に対して十分に正確ではない可能性があります。

変量因子の実際の水準がわからない場合、周辺予測区間を使用します。変量因子設定の特定の組み合わせがわかっている場合、条件付き予測区間を使用します。

これらの結果では、予測区間は、生育地1から得られる品種1のアルファルファの1つの新しい収穫量は3.462~4.309であり、ランダムに選択された生育地から得られる品種1のアルファルファの1つの新しい収穫量は2.536~4.424であることが95%信頼できることを示しています。

生産高の予測

混合効果モデル情報

畑 品種

設定

変数設定
1
品種1

予測

タイプ適合値適合値の標準誤差信頼区間自由度95%信頼区間予測区間自由度95%予測区間
条件付き3.8850.10315.58(3.666, 4.104)15.16(3.462, 4.309) 
周辺3.4800.1634.92(3.058, 3.902)4.92(2.536, 4.424)X
Xは、モデルの適合に使用される予測変数水準を基準にする異常な点を表します。