完全枝分かれ分散分析の方法と計算式

目的の方法または計算式を選択してください。

完全枝分かれ分散分析モデル

2つの因子(A、B)を持つバランス型計画の枝分かれ分散分析(ANOVA)モデルを表す式は以下になります。

yijk = μ .. + α i+ β j(i) ijk

上の式で、αi、βj(i)、およびεijkはすべて独立した正規確率変数で、予想は0、分散はそれぞれσ2α、σ2β、σ2です。

パラメータは次の式で推定されます。

μ .. = y̅...

α i = yi..− y̅...

β j(i) = yij.− y̅i..

上の式では、y̅... = すべての観測値の平均、yi.. = 因子Aのi番目での観測値の平均、yij. = 因子Aのi番目の水準における因子Bのj番目の水準での観測値の平均です。パラメータβ j(i)はAがi番目のときのBの効果を表しています。

アンバランス型計画のモデルに関する情報は、「ニーター1」を参照してください。
  1. J. Neter, W. Wasserman and M.H. Kutner (1985). Applied Linear Statistical Models. Second Edition. Irwin, Inc.

遂次平方和

距離の平方和です。SS 合計は、データ内の変動の合計です。SS(A)とSS(B)は、全体平均から推定される因子水準平均の変動量で、因子Aまたは因子Bの平方和としても知られます。誤差平方和は、適合値からの観測値の変動量です。計算は次のようになります。

Minitabでは、逐次平方和が計算されます。逐次平方和は因子をモデルに入力するときの順序によって異なります。これは、以前に入力された因子が何かある場合、1つの因子によって説明されるSS回帰の独特の部分です。

表記

用語説明
a因子Aの水準数
b因子Bの水準数
n総試行回数
yi.. 因子Aのi番目の因子水準の平均
y...すべての観測値の全体平均
y.j. 因子Bのj番目の因子水準の平均
yij.因子Aのi番目の水準および、因子Bのj番目の水準での観測値の平均

自由度(DF)

2つの因子A、Bを持つ完全枝分かれ分散分析モデルの自由度を表す式は以下になります。

上の式で、aは因子Aの水準の数、bは因子Bの水準の数で、nは試行回数を表しています。

平均平方(MS)

計算式

F

変量因子を持つモデルのF統計量の計算式です。

計算式

p値~分散分析表

p値は自由度(DF)が以下であるF分布から計算される確率です。

分子DF
項の自由度の和、または検定内の項
分母DF
誤差に対する自由度

計算式

1 − P(Ffj)

表記

用語説明
P(Ff)F分布についての累積分布関数
f検定におけるF統計量

分散成分

変量因子に対して算出されます。2つの変量因子を持つ枝分かれモデルは以下で表されます。

上の式で、αi、 βj(i)、および εijkはすべて独立した正規変量変数です。変数は、平均0とV(αi) = σ2α、V(βj) = σ2β、およびV(εijk) = σ2により与えられる分散により正規に分布されています。すべてのbj(i)は同じ分散を持つと仮定されており、σ2β、σ2α、σ2β、σ2αβ、σ2は分散成分と呼ばれています。

平均平方の期待値

2つの変量因子A、Bを持つモデルの平均平方の期待値を表す式は以下になります。

変量因子を持つモデルのF統計量

分散分析の出力におけるF統計量の計算方法

各F統計量は平均平方の比です。分子は項の平均平方です。分母は分子の平均平方の期待値が分母の平均平方の期待値から対象となる効果だけ離れるように選択します。ランダム項の効果は、項の分散成分によって表されます。固定項の効果は、その項に関連付けられたモデル成分の平方和をその自由度で割ったものによって表されます。したがって、F統計量が高い場合、効果が有意であることを示します。

モデルのすべての項が固定の場合、各F統計量の分母は誤差の平均平方(MSE)です。ただし、ランダム項を含むモデルについては、MSEが常に正しい平均平方になるとは限りません。平均平方の期待値(EMS)を使用して何が分母に適しているかを判断できます。

固定因子「画面」と変量因子「技術」で分散分析を実行し、平均平方の予測値(EMS)について次の出力が得られたとします。
要因 各項に対する平均平方の期待値
(1)画面 (4) + 2.0000(3) + Q[1]
(2)技術 (4) + 2.0000(3) + 4.0000(2)
(3)画面*技術 (4) + 2.0000(3)
(4)誤差 (4)

括弧に入った数字は、要因番号の横に記載する項に関連付けられたランダム効果を示します。(2)は技術のランダム効果を表し、(3)は画面*技術の交互作用のランダム効果を表し、(4)は誤差のランダム効果を表します。誤差のEMSは誤差項の効果です。さらに、画面*技術のEMSは誤差項の効果に画面*技術の交互作用の効果の2倍を加えたものです。

画面*技術のF統計量を計算するには、画面*技術の平均平方を誤差の平均平方で割って、分子の期待値(画面*技術のEMS = (4) + 2.0000(3))は分母の期待値(誤差のEMS = (4))から交互作用の効果(2.0000(3))だけ離れるようにします。したがって、F統計量が高い場合、画面*技術の交互作用が有意であることを示します。

Q[ ]が付いた数字は、要因番号の横に記載する項に関連付けられた固定効果を示します。たとえば、Q[1]は画面の固定効果です。画面のEMSは、誤差項の効果に画面*技術の交互作用の効果の2倍を加え、さらに画面の効果の定数倍を加えたものです。Q[1]は(b*n * sum((画面の水準の係数)**2))を(a - 1)で割ったものです。aとbはそれぞれ画面と技術の水準の数で、nは反復数です。

画面のF統計量を計算するには、画面の平均平方を画面*技術の平均平方で割って、分子の期待値(画面のEMS = (4) + 2.0000(3) + Q[1])が分母の期待値(画面*技術のEMS = (4) + 2.0000(3))から画面に起因する期待値(Q[1])だけ離れるようにします。したがって、F統計量が高い場合、画面の効果が有意であることを示します。

分散分析の出力で分散分析表のp値のそばに「x」とラベル「厳密なF検定ではありません」が表示される理由

項の正確なF検定とは、分子の平均平方の期待値が分母の平均平方の期待値から分散成分または対象の固定因子分だけ離れているものです。

ただし、こうした平均平方が計算できない場合もあります。この場合、Minitabでは近似のF検定の結果として得られる平均平方が使用され、p値のそばに「x」を表示して、F検定が正確でないことを示します。

たとえば、固定因子「補助材料」と変量因子「湖」で分散分析を実行し、平均平方の期待値(EMS)について次の出力が得られたとします。
要因 各項に対する平均平方の期待値
(1)補助材料 (4) + 1.7500(3) + Q[1]
(2)湖 (4) + 1.7143(3) + 5.1429(2)
(3)補助材料*湖 (4) + 1.7500(3)
(4)誤差 (4)

補助材料のF統計値は、補助材料の平均平方を補助材料*湖の交互作用の平均平方で割ったものです。補助材料の効果が非常に小さい場合、分子の期待値は分母の期待値と等しくなります。これは正確なF検定の例です。

ただし、湖の効果が非常に小さい場合、分子の期待値が分母の期待と等しくなるような平均平方は存在しない点に注意してください。したがって、Minitabでは近似のF検定が使用されます。この例では、湖の平均平方を補助材料*湖の交互作用の平均平方で割ります。これにより、湖の効果が非常に小さい場合、分子の期待値は分母の期待値とほぼ等しいという結果が得られます。

「F検定の分母がゼロまたは定義されていません」というメッセージについて

MinitabでF検定の分母がゼロまたは定義されていないというエラーが表示される理由は、次のいずれかです。
  • 少なくとも1つの誤差に対する自由度が存在しない場合があります。
  • 調整されたMS値が非常に小さく、F値やp値を表示する十分な精度に満たない場合。回避方法として、応答列を10倍にします。次に、同じ回帰モデルを実行しますが、応答にはこの新しい応答列を使用します。

    応答値を10倍しても、Minitabで出力として表示されるF値およびp値には影響しません。ただし、それ以外の出力、具体的には逐次平方和、調整平方和、調整平均平方、適合値、適合値の標準誤差、残差列では小数点の位置が変わります。

分散分析の出力におけるF統計量の計算方法

各F統計量は平均平方の比です。分子は項の平均平方です。分母は分子の平均平方の期待値が分母の平均平方の期待値から対象となる効果だけ離れるように選択します。ランダム項の効果は、項の分散成分によって表されます。固定項の効果は、その項に関連付けられたモデル成分の平方和をその自由度で割ったものによって表されます。したがって、F統計量が高い場合、効果が有意であることを示します。

モデルのすべての項が固定の場合、各F統計量の分母は誤差の平均平方(MSE)です。ただし、ランダム項を含むモデルについては、MSEが常に正しい平均平方になるとは限りません。平均平方の期待値(EMS)を使用して何が分母に適しているかを判断できます。

固定因子「画面」と変量因子「技術」で分散分析を実行し、平均平方の予測値(EMS)について次の出力が得られたとします。
要因 各項に対する平均平方の期待値
(1)画面 (4) + 2.0000(3) + Q[1]
(2)技術 (4) + 2.0000(3) + 4.0000(2)
(3)画面*技術 (4) + 2.0000(3)
(4)誤差 (4)

括弧に入った数字は、要因番号の横に記載する項に関連付けられたランダム効果を示します。(2)は技術のランダム効果を表し、(3)は画面*技術の交互作用のランダム効果を表し、(4)は誤差のランダム効果を表します。誤差のEMSは誤差項の効果です。さらに、画面*技術のEMSは誤差項の効果に画面*技術の交互作用の効果の2倍を加えたものです。

画面*技術のF統計量を計算するには、画面*技術の平均平方を誤差の平均平方で割って、分子の期待値(画面*技術のEMS = (4) + 2.0000(3))は分母の期待値(誤差のEMS = (4))から交互作用の効果(2.0000(3))だけ離れるようにします。したがって、F統計量が高い場合、画面*技術の交互作用が有意であることを示します。

Q[ ]が付いた数字は、要因番号の横に記載する項に関連付けられた固定効果を示します。たとえば、Q[1]は画面の固定効果です。画面のEMSは、誤差項の効果に画面*技術の交互作用の効果の2倍を加え、さらに画面の効果の定数倍を加えたものです。Q[1]は(b*n * sum((画面の水準の係数)**2))を(a - 1)で割ったものです。aとbはそれぞれ画面と技術の水準の数で、nは反復数です。

画面のF統計量を計算するには、画面の平均平方を画面*技術の平均平方で割って、分子の期待値(画面のEMS = (4) + 2.0000(3) + Q[1])が分母の期待値(画面*技術のEMS = (4) + 2.0000(3))から画面に起因する期待値(Q[1])だけ離れるようにします。したがって、F統計量が高い場合、画面の効果が有意であることを示します。

分散分析の出力で分散分析表のp値のそばに「x」とラベル「厳密なF検定ではありません」が表示される理由

項の正確なF検定とは、分子の平均平方の期待値が分母の平均平方の期待値から分散成分または対象の固定因子分だけ離れているものです。

ただし、こうした平均平方が計算できない場合もあります。この場合、Minitabでは近似のF検定の結果として得られる平均平方が使用され、p値のそばに「x」を表示して、F検定が正確でないことを示します。

たとえば、固定因子「補助材料」と変量因子「湖」で分散分析を実行し、平均平方の期待値(EMS)について次の出力が得られたとします。
要因 各項に対する平均平方の期待値
(1)補助材料 (4) + 1.7500(3) + Q[1]
(2)湖 (4) + 1.7143(3) + 5.1429(2)
(3)補助材料*湖 (4) + 1.7500(3)
(4)誤差 (4)

補助材料のF統計値は、補助材料の平均平方を補助材料*湖の交互作用の平均平方で割ったものです。補助材料の効果が非常に小さい場合、分子の期待値は分母の期待値と等しくなります。これは正確なF検定の例です。

ただし、湖の効果が非常に小さい場合、分子の期待値が分母の期待と等しくなるような平均平方は存在しない点に注意してください。したがって、Minitabでは近似のF検定が使用されます。この例では、湖の平均平方を補助材料*湖の交互作用の平均平方で割ります。これにより、湖の効果が非常に小さい場合、分子の期待値は分母の期待値とほぼ等しいという結果が得られます。

「F検定の分母がゼロまたは定義されていません」というメッセージについて

MinitabでF検定の分母がゼロまたは定義されていないというエラーが表示される理由は、次のいずれかです。
  • 少なくとも1つの誤差に対する自由度が存在しない場合があります。
  • 調整されたMS値が非常に小さく、F値やp値を表示する十分な精度に満たない場合。回避方法として、応答列を10倍にします。次に、同じ回帰モデルを実行しますが、応答にはこの新しい応答列を使用します。

    応答値を10倍しても、Minitabで出力として表示されるF値およびp値には影響しません。ただし、それ以外の出力、具体的には逐次平方和、調整平方和、調整平均平方、適合値、適合値の標準誤差、残差列では小数点の位置が変わります。