適合線プロットの逐次分散分析表

逐次分散分析表のすべての統計量の定義と解釈について解説します。

自由度(DF)

総自由度は、データに含まれる情報量のことです。この情報から、未知の母集団のパラメータの値を分析し推定します。総自由度は、サンプルに含まれる観測値の数によって決定されます。項の自由度は、その項が使う情報量を示します。サンプルサイズを大きくすると、母集団に関して提供される情報が増え、総自由度が高くなります。モデルに含める項の数を増やすと情報量が増え、パラメータ推定値の変動性を推定するのに使える自由度が低くなります。

2つの条件が一致すると、Minitabは誤差の自由度を分割します。1つ目の条件は、現在のモデルには含まれていない、データと適合できる項があることです。たとえば、3つ以上の異なる値を持つ連続予測変数がある場合、その予測変数に対して2次項を推定できます。モデルが2次項を含まない場合、データと適合できる項はモデルに含まれていないので、この条件は満たされていることになります。

2つ目の条件は、データに反復が含まれていることです。反復とは、各予測変数の値が同じ観測値のことを言います。たとえば、圧力5、温度25の観測値が3つある場合、それら3つの観測値は反復となります。

2つの条件が一致すると、誤差の自由度の2つの部分は不適合かつ純誤差となります。不適合の自由度は、モデル形式が適切かどうかの検定を可能にします。不適合検定では、不適合に対する自由度が使用されます。純粋誤差の自由度が大きいほど、不適合検定の検定力は高くなります。

平方和(SS)

逐次平方和(SS)は、モデル内の異なる成分の変動の測度です。調整平方和と異なり、逐次平方和は項がモデルに追加された順序に依存します。逐次分散分析表では、モデル内の逐次平方和は多項式(1次、2次、3次)ごとに分けられます。

平方和(SS)
多項式の項ごとの逐次平方和は、モデルに入力済みの低次項で説明づけられない項で説明される分散の固有部です。モデルに逐次追加されるときに、多項式の項ごとに説明される応答データの分散量を定量化します。
全体逐次平方和
全体平方和は、項の平方和と誤差の平方和の合計です。データの変動全体を定量化します。

解釈

Minitabでは、逐次平方和を使用して項のp値を計算します。また、平方和を使用してR2の統計量も計算します。通常は、平方和ではなく、p値とR2統計量を解釈します。

F値

F値は、モデルが応答と関係があるかどうかを判断するために使用する検定統計量です。

解釈

F値を使用してMinitabで計算されるp値に基づいて、モデルの統計的有意性に関する決定を下すことができます。p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

F値が十分に大きい場合、モデルが有意であることを示します。

F値から帰無仮説を棄却するかどうかを判断するには、F値を棄却限界値と比較します。Minitabで棄却限界値を計算することも、ほとんどの統計に関する書籍に掲載されているF分布表で棄却値を見つけることもできます。Minitabでの棄却限界値の計算方法については、 逆累積分布関数(ICDF)の使用に進み、「逆累積分布関数で棄却限界値を計算する」をクリックします。

p値…項

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項の係数は0に等しく、項と応答に関連性がないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意です
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。2次モデルまたは3次モデルを適合して、2次または3次の項が有意な場合、データに曲面性が含まれると結論付けることができます。
p値 > α:その関連性は統計的に有意ではありません

p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論することはできません。2次モデルまたは3次モデルを適合して、2次または3次の項が統計的に有意でない場合、別のモデルを選んでみてください。