一般線形モデルの適合の分散分析の方法と計算式

目的の方法または計算式を選択してください。

平方和(SS)

行列項において、異なる平方和の計算式は以下になります。

Minitabでは、逐次平方和と調整平方和の両方を使って回帰平方和の成分または処理平方和の成分を各項で説明される変動量に分解します。

表記

用語説明
b係数のベクトル
X計画行列
Y応答値のベクトル
n観測値数
J全て1のn×n行列

遂次平方和

Minitabでは、分散のSS回帰成分または処理成分を各因子の遂次平方和に分解します。遂次平方和は、因子や予測変数をモデルに入力するときの順序によって異なります。逐次平方和は、以前に入力された因子が何かある場合、1つの因子によって説明される回帰平方和の独特の部分です。

たとえば、X1、X2、X3という3つの因子または予測変数を含むモデルがある場合、X2の遂次平方和は、X1がモデル内にすでに含まれている場合、X2によって説明される残りの変動の割合を示します。別の平方和を得るには、分析を繰り返して異なる順序で因子を入力します。

調整平方和

調整平方和は、項をモデルに入力するときの順序に依存しません。調整平方和は、その他のすべての項が入力された順序にかかわらずモデル内に含まれる場合に、項によって説明される変動量を表します。

たとえば、3つの因子X1、X2、X3を扱うモデルがあった場合、X2の項が、調整平方和はX2の残りの変動にどれほど寄与しているのかを表します。モデル内のX1およびX3も同様です。

3つの因子の調整平方和の計算式は以下になります。

  • SSR(X3 | X1, X2) = SSE (X1, X2) - SSE (X1, X2, X3)または
  • SSR(X3 | X1, X2) = SSR (X1, X2, X3) - SSR (X1, X2)

上の式で、SSR(X3 | X1, X2)は、X1とX2がモデルに含まれる場合のX3の調整平方和です。

  • SSR(X2, X3 | X1) = SSE (X1) - SSE (X1, X2, X3)または
  • SSR(X2, X3 | X1) = SSR (X1, X2, X3) - SSR (X1)

上の式で、SSR(X2, X3 | X1)は、X1がモデルに含まれる場合のX2とX3の調整平方和です。

モデル1に4つ以上の因子がある場合はこの式を拡張して計算します。

  1. J. Neter、W. WassermanおよびM.H. Kutner(1985年)、Applied Linear Statistical Models第2版、Irwin, Inc.

自由度(DF)

モデルの各成分の自由度は以下の通りです。

変動要因 自由度(DF)
因子 ki – 1
共変量と共変量間の交互作用 1
因子を含む交互作用
回帰 p
エラー n p – 1
合計 n – 1

データが一定の基準を満たし、モデルに少なくとも1つの連続予測変数が含まれるか、1つ以上のカテゴリ予測変数が含まれる場合、不適合検定にある程度の自由度が使用されます。基準は以下の通りです。
  • データに同じ予測値を持つ複数の観測値が含まれる。
  • データにモデルに含まれていない追加項を推定する正しい点が含まれる。

表記

用語説明
kii番目の因子の水準数
m因子数
n 観測値数
p 定数を含まないモデル内の係数の数

調整平均平方~回帰

回帰の平均平方(MS)を表す式は以下になります。

表記

用語説明
平均応答
i番目の適合された応答
pモデルにおける項の数

調整平均平方…誤差

平均平方誤差(略はMS ErrorまたはMSE、表記はs2)は適合回帰線からの分散です。式は以下になります。

表記

用語説明
yii番目の観測された応答値
i番目の適合された応答
n観測値数
p定数を含まないモデル内の係数の数

F

モデルに含まれる全ての因子が固定されている場合、F統計量の計算は、以下のように仮説検定手法により変わります。

F(項)
F(不適合度)

モデルに変量因子がある場合、Fは各項の平均平方の期待値情報を使って構築されます。詳細は、ニーターその他を参照してください。1

表記

用語説明
調整平均平方項モデル内に含まれるその他の項を説明した後、項によってどれだけの変動を説明できるかを測定する測度です。
平均平方誤差モデルによって説明できない変動を測定する測度です。
平均平方不適合度モデルに項を追加することによってモデル化できる応答の変動を測定する測度です。
平均平方純粋誤差反復応答データの変動を測定する測度です。
  1. J. Neter, W. Wasserman and M.H. Kutner (1985). Applied Linear Statistical Models, 第2版 Irwin, Inc.

p値~分散分析表

p値は自由度(DF)が以下であるF分布から計算される確率です。

分子DF
項の自由度の和、または検定内の項
分母DF
誤差に対する自由度

計算式

1 − P(Ffj)

表記

用語説明
P(Ff)F分布についての累積分布関数
f検定におけるF統計量

純粋誤差不適合検定

純粋誤差不適合検定の算定で、Minitabは以下の計算を行います。
  1. 各反復セットにおける平均からの応答の偏差の平方和を合計し純粋誤差の平方和を生成
  2. 純誤差の平均平方

    上の式で、nは観測値の数、mはx水準の組み合わせの数です。

  3. 不適合平方和
  4. 不適合平均平方
  5. 検定統計量

F値が大きい場合やp値が小さい場合は、そのモデルが不適切であると示唆しています。

p値~不適合検定

p値は、モデルに含まれていないこれらのデータから推定することができる項で全ての係数が0であるという帰無仮説検定に使います。p値は次のような自由度(DF)のF分布から算出する確率です。
分子DF
不適合に対する自由度
分母DF
純粋誤差に対する自由度

計算式

1 − P(Ffj)

表記

用語説明
P(Ffj)F分布についての累積分布関数
fj検定におけるF統計量