混合効果モデルの当てはめの条件付き適合値と診断の表

条件付き適合値と診断の表のすべての統計量の定義と解釈について解説します。

条件付き適合値

条件付き適合値は、データセットで与えられる固定および変量因子設定の両方における平均応答値の推定値です。条件付き適合値は、条件付き適合式により算出されます。

適合値の標準誤差(SE Fit)

適合値の標準誤差(SE Fit)は、特定の変数設定について推定される平均応答の変動を推定します。平均応答の信頼区間の計算には、適合値の標準誤差が使用されます。標準誤差は常に正数です。

条件付き平均の自由度

自由度(DF)は、平均応答の信頼区間を推定するデータの情報量を表します。

解釈

自由度を使用して、異なる条件付き平均に利用できる情報量を比較します。一般に、自由度が多いほど、平均の信頼区間は自由度が少ない場合よりも狭くなります。異なる観測値の平均の標準誤差には差があるので、自由度が多い平均の信頼区間は、自由度が少ない平均の信頼区間より狭くある必要はありません。

条件付き平均の信頼区間(95%の信頼区間)

信頼区間(Cl)は、対応する条件付き平均応答が含まれている可能性のある値の範囲です。

データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。

信頼区間は、次の2つの部分で構成されています。

解釈

信頼区間を使用して、条件付き平均応答が特定の値と比較して統計的に大きいか同等か、あるいは小さいかを評価します。また、対応する未知の条件付き平均応答が含まれる可能性のある値の範囲を特定することもできます。

条件付き残差

残差(ei)とは、観測値(y)とそれに対応する条件付き適合値().

解釈

残差をプロットし、モデルが適切であり、混合効果モデルの仮定が満たされているかどうかを確認できます。残差を調べることにより、データに対するモデルの適合度に関して有用な情報を得ることができます。一般的に、残差はランダムに分布し、明確なパターンや異常値がありません。Minitabが、データに異常な観測値が含まれていると判断した場合は、これらの観測値が特定された、異常な観測値の条件付き適合値と診断の表が出力されます。ラベルが付けられた異常な観測値は、提示された条件付き計算式にしっかりと従っていません。ただし、いくつかの異常な観測値があることは予測されています。たとえば、大きな残差の基準に基づくと、観測値の約5%は大きな残差を持つとしてフラグが付けられることが予測されます。

標準化残差(Std Resid)

条件付き標準化残差は、残差(ei)をその標準偏差の推定値で割ったものです。

解釈

条件付き標準化残差を使用すると、外れ値を検出しやすくなります。2より大きく、-2より小さい条件付き標準化残差は、通常は大きなものであると見なされます。異常な観測値の条件付き適合値と診断の表では、これらの観測値が「R」で示されます。ラベルが付けられた観測値は、提示された条件付き適合式にしっかりと従っていません。ただし、いくつかの異常な観測値があることは予測されています。たとえば、大きな条件付き標準化残差の基準に基づくと、観測値の約5%は大きな標準化残差を持つとしてフラグがつけられることが予測されます。

条件付き標準化残差が役に立つのは、生の条件付き残差が外れ値を識別するものとして許容されない場合があるためです。生の条件付き残差の分散は、それに関連づけられたx値によって異なることがあります。この残差の不一致では、生の条件付き残差の大きさを評価するのが難しくなります。条件付き残差を標準化することで、異なる分散が共通の尺度に変換され、この問題は解消されます。