偏最小二乗回帰の分散分析表

分散分析表のすべての統計量の定義と解釈について解説します。

自由度(DF)

合計自由度(DF)は、データに含まれる情報量のことです。分析では、その情報を使用して、未知の母集団のパラメータ値を推定します。合計自由度は、サンプルに含まれる観測値の数によって決定されます。サンプルサイズを大きくすると、母集団に関して提供される情報が増え、合計自由度が高くなります。

回帰の自由度は、成分がどれだけの情報を使用するかを示します。成分数を増やすと、より多くの情報を使用することになり、残差誤差の自由度が減少します。残差誤差の自由度は、パラメータ推定の分散を推定するために利用できる情報量を示します。

平方和(SS)

平方和(SS)は、調整された平方和であり、モデル内の異なる成分の変動の測度です。平方和は、異なる要因による変動を説明する成分に分けられます。

平方和回帰
平方和回帰は、平均反応値で適合させた反応値の偏差を二乗したものの和です。モデルにより説明される応答データの変動量を定量化します。
平方和誤差
誤差平方和は残差の平方和です。予測変数で説明できないデータの変動を定量化します。
全体平方和
全体平方和は、回帰平方和に誤差平方和を足したものです。データの変動全体を定量化します。

解釈

Minitabでは、調整平方和を使用して項のp値を計算します。また、平方和を使用してR2の統計量も計算します。通常は、平方和ではなく、p値とR2統計量を解釈します。

平均平方(MS)

平均平方(MS)は、調整された平均平方であり、項やモデルによってどれだけの変動を説明できるかを測定するものです。このとき、その他のすべての項は、入力された順序にかかわらずモデル内にあると仮定します。調整平方和と異なり、調整平均平方では、自由度が考慮されます。

調整平均平方誤差(MSEまたはs2とも呼ばれる)は、適合値の周辺の分散のことです。

解釈

Minitabでは、調整平均平方を使用して項のp値を計算します。また、調整平均平方を使用して調整済みR2の統計量も計算します。通常は、調整平均平方ではなく、p値と調整済みR2の統計量を解釈します。

F値

F値は、モデルが応答と関係があるかどうかを判断するために使用する検定統計量です。

解釈

F値を使用してMinitabで計算されるp値に基づいて、モデルの統計的有意性に関する決定を下すことができます。p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

F値が十分に大きい場合、モデルが有意であることを示します。

F値を使用して帰無仮説を棄却するかどうかを判断する場合、F値を基準値と比較します。Minitabで棄却限界値を計算することも、ほとんどの統計に関する書籍に掲載されているF分布表で棄却値を見つけることもできます。Minitabを使用して基準値を計算する方法の詳細については逆累積分布関数(ICDF)の使用を参照し、「逆累積分布関数(ICDF)を使用して基準値を計算する」をクリックしてください。

p値 – 回帰

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

モデルによって応答の変動を説明できるかどうかを判断するには、モデルのp値と有意水準を比較して帰無仮説を評価します。全体回帰の帰無仮説は、モデルでは応答の変動は説明できないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際にはモデルによって応答の変動は説明できないにも関わらず、説明できると結論付ける可能性が5%であることを示しています。
p値 ≤ α:モデルにより応答での変動が説明されます
p値が有意水準以下の場合は、そのモデルにより応答での変動が説明されると結論付けます。
p値 > α: 応答での変動はモデルによって説明されると結論付けるだけの十分な証拠はありません

p値が有意水準より大きい場合、そのモデルにより応答での変動が説明されると結論することはできません。新しいモデルを適合することができます。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください