完全枝分かれ分散分析のすべての統計量およびグラフを解釈する

完全枝分かれ分散分析(ANOVA)で使用される、すべての統計量およびグラフの定義と解釈について解説します。

自由度(DF)

総自由度は、データに含まれる情報量のことです。この情報から、未知の母集団を分析し推定します。総自由度は、サンプルに含まれる観測値の数によって決定されます。項の自由度は、その項が使う情報量を示します。サンプルサイズを大きくすると、母集団に関して提供される情報が増え、総自由度が高くなります。モデルに含める項の数を増やすと情報量が増え、パラメータ推定値の変動性を推定するのに使える自由度が低くなります。

平方和(SS)

逐次平方和は、モデル内の異なる成分の変動の測度です。調整平方和と異なり、逐次平方和は項がモデルに追加された順序に依存します。分散分析表では、逐次平方和は、異なる要因による変動を説明する成分に分けられます。

逐次平方和項
項の逐次平方和は、前に追加された項からは説明されない項によって説明できる変動の固有の部分です。モデルに順次追加される各項によって説明される応答データの変動量を数値化します。
逐次誤差平方和
誤差平方和は残差の平方和です。予測変数では説明できないデータの変動を定量化します。
全体逐次平方和
全体平方和は、項の平方和と誤差の平方和の合計です。データの変動全体を定量化します。

解釈

Minitabでは、逐次平方和を使用して項のp値を計算します。通常は、平方和の代わりにp値を解釈します。

平均平方(MS)

逐次平均平方は、項やモデルによってどれだけの変動を説明できるかを測定するものです。遂次平均平方は、項がモデルに入力された順序によって異なります。逐次平方和と異なり、逐次平均平方では、自由度が考慮されます。

逐次平均平方誤差(MSEまたはs2)は適合値からの分散です。

解釈

Minitabでは、逐次平均平方を使用して項のp値を計算します。また、逐次平均平方を使用して調整済みR2の統計量も計算します。通常は、逐次平均平方ではなく、p値と調整済みR2統計量を解釈します。

F値

F値は分散分析表の各項に表示されます。F値は項が応答に関連付けられているかを判断する検定統計量です。

解釈

F値を使用してMinitabで計算されるp値に基づいて、項およびモデルの統計的有意性に関する決定を下すことができます。p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

F値の大きさが十分であれば、その項またはモデルが有意であることを示します。

F値から帰無仮説を棄却するかどうかを判断するには、F値を棄却限界値と比較します。Minitabで棄却限界値を計算することも、ほとんどの統計に関する書籍に掲載されているF分布表で棄却値を見つけることもできます。Minitabでの棄却限界値の計算方法については、逆累積分布関数(ICDF)の使用に進み、「逆累積分布関数で棄却限界値を計算する」をクリックします。

p値

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項と応答に関連性がないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意です
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α:その関連性は統計的に有意ではありません
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論付けることはできません。項を持たないモデルを再適合したいと考えるかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。

完全枝分かれ分散分析モデルのすべての因子はランダムです。したがって、統計的に有意な因子は、応答での変動量に寄与することを示します。

完全枝分かれ計画がアンバランスの場合、F値とp値は計算されません。

分散成分

分散成分は、分散分析表の各変量項に起因する、応答に含まれる変動の量を推定します。

解釈

分析における変動のうち、変量項が原因の変動量を評価します。値が高いほど、項は応答に対しより多くの変動性を与えることを示しています。

合計の%(分散)

合計の%は、モデル内のランダムな各項が寄与する合計分散のパーセントを推定します。各要因の分散を全変動で割り、パーセントで表すために100を掛けて計算されます。

分散成分推定値が0より小さい場合、全体の変動性のパーセントは0と表示されます。

解釈

合計分散のパーセントを使い各要因による変動を評価します。

標準偏差

StDevは、分散成分表内のランダムな各項の標準偏差です。標準偏差は、その要因の分散の平方根に等しくなります。

標準偏差は、応答変数と同じ測定単位を使用するため、変動の測定値として便利です。

平均平方の期待値

ランダム項を含むモデルにおいて、平均平方の期待値は各変動要因がどのように変数の線形結合で構成されているのかを表します。

解釈

Minitabでは、線形結合を使用して合成された検定の誤差項と分散成分を求めます。通常は、平均平方の期待値ではなく、合成された検定から得られる分散成分とp値を解釈します。