回帰モデルの適合と線形回帰の分散分析表

分散分析表のすべての統計量の定義と解釈について解説します。

このトピックの内容

自由度（DF）
調整平方和
調整平均平方
逐次平方和（Seq SS）
逐次平均平方
寄与度
F値
p値 – 回帰
p値 – 項
p値 - 不適合度

自由度（DF）

総自由度は、データに含まれる情報量のことです。この情報から、未知の母集団のパラメータの値を分析し推定します。総自由度は、サンプルに含まれる観測値の数によって決定されます。項の自由度は、その項が使う情報量を示します。サンプルサイズを大きくすると、母集団に関して提供される情報が増え、総自由度が高くなります。モデルに含める項の数を増やすと情報量が増え、パラメータ推定値の変動性を推定するのに使える自由度が低くなります。

2つの条件が一致すると、Minitabは誤差の自由度を分割します。1つ目の条件は、現在のモデルには含まれていない、データと適合できる項があることです。たとえば、3つ以上の異なる値を持つ連続予測変数がある場合、その予測変数に対して2次項を推定できます。モデルが2次項を含まない場合、データと適合できる項はモデルに含まれていないので、この条件は満たされていることになります。

2つ目の条件は、データに反復が含まれていることです。反復とは、各予測変数の値が同じ観測値のことを言います。たとえば、圧力5、温度25の観測値が3つある場合、それら３つの観測値は反復となります。

2つの条件が一致すると、誤差の自由度の2つの部分は不適合かつ純誤差となります。不適合の自由度は、モデル形式が適切かどうかの検定を可能にします。不適合検定では、不適合に対する自由度が使用されます。純粋誤差の自由度が大きいほど、不適合検定の検定力は高くなります。

調整平方和

調整平方和は、モデル内の異なる成分の変動の測度です。モデル内の予測変数の次数は、調整平方和の計算に影響を及ぼしません。分散分析表では、調整平方和は、異なる要因による変動を説明する成分に分けられます。

調整平方和項: 項の調整平方和は、他の項だけを持つモデルと比較した場合の回帰平方和の増加を表します。モデルに含まれる各項によって説明される応答データの変動量を数値化します。
調整誤差平方和: 誤差平方和は残差の平方和です。予測変数では説明できないデータの変動を定量化します。
調整全体平方和: 全体平方和は、項の平方和と誤差の平方和の合計です。データ内の変動の合計を数値化します。

解釈

Minitabでは、調整平方和を使用して項のp値を計算します。また、平方和を使用してR²の統計量も計算します。通常は、平方和ではなく、p値とR²統計量を解釈します。

調整平均平方

調整平均平方は、項やモデルによってどれだけの変動を説明できるかを測定するものです。このとき、その他のすべての項は、入力された順序にかかわらずモデル内に含まれると仮定します。調整平方和と異なり、調整平均平方では、自由度が考慮されます。

調整平均平方誤差（平均平方誤差またはs²）は適合値からの分散です。

解釈

Minitabでは、調整平均平方を使用して項のp値を計算します。また、調整平均平方を使用して調整済みR²の統計量も計算します。通常は、調整平均平方ではなく、p値と調整済みR²統計量を解釈します。

逐次平方和（Seq SS）

逐次平方和は、モデル内の異なる成分の変動の測度です。調整平方和と異なり、逐次平方和は項がモデルに追加された順序に依存します。分散分析表では、逐次平方和は、異なる要因による変動を説明する成分に分けられます。

逐次平方和回帰: 平方和回帰は、平均反応値で適合させた反応値の偏差を二乗したものの和です。モデルにより説明される応答データの変動量を定量化します。
逐次平方和項: 項の逐次平方和は、前に追加された項からは説明されない項によって説明できる変動の固有の部分です。モデルに順次追加される各項によって説明される応答データの変動量を数値化します。
逐次誤差平方和: 誤差平方和は残差の平方和です。予測変数では説明できないデータの変動を定量化します。
全体逐次平方和: 全体平方和は、逐次項の平方和と誤差の平方和の合計です。データの変動全体を定量化します。

解釈

デフォルトでは、調整平方和を使用して項のp値を計算します。適切な場合、逐次平方和から項のp値を計算できます。通常は、平方和の代わりにp値を解釈します。

逐次平均平方

逐次平均平方は、項やモデルによってどれだけの変動を説明できるかを測定するものです。遂次平均平方は、項をモデルに入力するときの順序によって異なります。逐次平方和と異なり、逐次平均平方では、自由度が考慮されます。

逐次平均平方誤差（MSEまたはs²）は適合値からの分散です。

解釈

Minitabでは、逐次平均平方を使用して項のp値を計算します。また、逐次平均平方を使用して調整済みR²の統計量も計算します。通常は、逐次平均平方ではなく、p値と調整済みR²統計量を解釈します。

寄与度

寄与度は、分散分析表の各要因が合計逐次平方和（Seq SS）に寄与する割合を示しています。

解釈

割合が高いほど、要因がより応答の変動の原因になっていることを示しています。

F値

F値は分散分析表の各項に表示されます。

モデルまたは項におけるF値: F値は項が応答に関連付けられているかを判断する検定統計量です。
不適合度検定におけるF値: F値は、モデルに対し、そのモデルの予測変数が含まれる高次項を欠損しているかを判断する検定統計量です。

解釈

F値を使用してMinitabで計算されるp値に基づいて、項およびモデルの統計的有意性に関する決定を下すことができます。p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

F値の大きさが十分であれば、その項またはモデルが有意であることを示します。

F値から帰無仮説を棄却するかどうかを判断するには、F値を棄却限界値と比較します。Minitabで棄却限界値を計算することも、ほとんどの統計に関する書籍に掲載されているF分布表で棄却値を見つけることもできます。Minitabでの棄却限界値の計算方法については、逆累積分布関数（ICDF）の使用に進み、「逆累積分布関数で棄却限界値を計算する」をクリックします。

p値 – 回帰

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

モデルによって応答の変動を説明できるかどうかを判断するには、モデルのp値と有意水準を比較して帰無仮説を評価します。全体回帰の帰無仮説は、モデルでは応答の変動は説明できないという仮定です。通常は、有意水準（αまたはアルファとも呼ばれる）として0.05が適切です。0.05の有意水準は、実際にはモデルによって応答の変動は説明できないにも関わらず、説明できると結論付ける可能性が5%であることを示しています。

p値 ≤ α：モデルにより応答での変動が説明されます: p値が有意水準以下の場合は、そのモデルにより応答での変動が説明されると結論付けます。
p値 > α: 応答での変動はモデルによって説明されると結論付けるだけの十分な証拠はありません: p値が有意水準より大きい場合、そのモデルにより応答での変動が説明されると結論することはできません。新しいモデルを適合することができます。

p値 – 項

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項と応答に関連性がないという仮定です。通常は、有意水準（αまたはアルファとも呼ばれる）として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。

p値 ≤ α：関連性は統計的に有意です: p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α：その関連性は統計的に有意ではありません: p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論付けることはできません。項を持たないモデルを再適合したいと考えるかもしれません。; 応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。

モデル項が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は以下のとおりです。

連続予測変数が有意な場合は、予測変数の係数は0ではないと結論付けることができます。
カテゴリ予測変数が有意な場合は、すべての水準平均が等しいとは限らないと結論できます。
交互作用項が有意な場合は、予測変数と応答の間の関係がその項の他の予測変数に依存すると結論付けることができます。
多項式項が有意な場合は、データに曲面性が含まれると結論付けることができます。

p値 - 不適合度

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。Minitabでは、同じx値を持つ複数の観測値である反復がデータに含まれている場合に純粋誤差不適合検定が自動的に実行されます。反復は、「純粋誤差」を表します。これは、ランダム変動だけが複数の応答観測値の差を引き起こすためです。

解釈

モデルによって応答と予測の関係が正しく指定されるかどうかを判断するには、不適合度検定のp値と有意水準を比較して帰無仮説を評価します。不適合度検定の帰無仮説は、モデルによって応答と予測の関係が正しく指定されるという仮定です。通常は、有意水準（αまたはアルファとも呼ばれる）として0.05が適切です。0.05の有意水準は、実際にはモデルによって応答と予測の関係が正しく指定されるのにも関わらず、正しく指定されないと結論付ける可能性が5%であることを示しています。

p値 ≤ α：その不適合は統計的に有意です: p値が有意水準以下の場合は、そのモデルでは関係が正しく指定されないと結論付けます。モデルを改善するには、項を追加するか、またはデータを変換する必要があります。
p値 > α：その不適合は統計的に有意ではありません: p値が有意水準より大きい場合は、検定で不適合が何も検出されません。

回帰モデルの適合と 線形回帰の 分散分析表