混合計画の分析の分散分析表

分散分析表のすべての統計量の定義と解釈について解説します。

自由度(DF)

合計自由度(DF)は、データに含まれる情報量のことです。分析では、その情報を使用して、未知の母集団のパラメータ値を推定します。合計自由度は、サンプルに含まれる観測値の数によって決定されます。項の自由度は、その項が使う情報量を示します。サンプルサイズを大きくすると、母集団に関して提供される情報が増え、合計自由度が高くなります。モデルに含める項の数を増やすと情報量が増え、パラメータ推定値の変動性を推定するのに使える自由度が低くなります。

解釈

合計自由度は観測値の数によって異なります。混合計画では合計自由度は観測値数から1を引いた値です。項の自由度は、その項に対して推定された係数の数です。残差誤差の自由度は、すべてのモデル項説明後に残されたものです。

逐次平方和(Seq SS)

逐次平方和は、モデルに一覧された異なる要因の変動の測度です。調整平方和と異なり、逐次平方和は項がモデルに追加された順序に依存します。分散分析表では、逐次平方和は下記に示すように、異なる要因に分けられます。

逐次平方和回帰
モデル全体の逐次平方和は、モデルに含まれる全体平方和と誤差平方和の差です。モデルに含まれる項のすべての逐次平方和の合計です。
項のグループの逐次平方和
モデルに含まれる項のグループに対する逐次平方和は、グループ内のすべての項に対する逐次平方和の合計です。項のグループにより説明される応答データの変動量を定量化します。
逐次平方和項
項の逐次平方和は、分散分析表のモデル上に他の項だけを持つモデルと比較した場合のモデル平方和の増加を表します。
残差誤差の逐次平方和
誤差平方和は残差の平方和です。予測変数では説明できないデータの変動を定量化します。
逐次平方和純粋誤差
純粋誤差平方和は誤差平方和の一部です。純粋誤差平方和は、純粋誤差の自由度があるときに存在します。詳細は、このトピックの自由度(DF)を参照してください。同じ因子値を持つ観測値のデータの変動を定量化します。
全体逐次平方和
全体平方和は、モデルの平方和と誤差の平方和の合計です。データの変動全体を定量化します。

解釈

計画分析時にp値を計算するためには逐次平方和は使用しませんが、回帰モデルの適合または一般線形モデルの適合を使用するときに逐次平方和を使用できます。通常、調整平方和を基に、p値とR2統計量を解釈します。

調整平方和(Adj SS)

調整平方和は、モデルに一覧された異なる要因の変動の測度です。モデル内の予測変数の次数は、調整平方和の計算に影響を及ぼしません。分散分析表では、調整平方和は下記に示すように、異なる要因に分けられます。

調整平方和回帰
モデル全体の調整平方和は、全体平方和と誤差平方和の差です。モデルに含まれる項のすべての調整平方和の合計です。
項のグループの調整平方和
モデルに含まれる項のグループに対する調整平方和は、グループ内のすべての項に対する調整平方和の合計です。項のグループにより説明される応答データの変動量を定量化します。
調整平方和項
項の調整平方和は、他の項だけを持つモデルと比較した場合のモデル平方和の増加を表します。項によって説明される応答データの変動量を定量化します。
残差誤差の調整平方和
誤差平方和は残差の平方和です。モデルで説明づけられないデータの変動を定量化します。
純粋誤差の調整平方和
純粋誤差平方和は誤差平方和の一部です。純粋誤差平方和は、純粋誤差の自由度があるときに存在します。詳細は、このトピックの自由度(DF)を参照してください。同じ因子値を持つ観測値のデータの変動を定量化します。
調整全体平方和
全体平方和は、モデルの平方和と誤差の平方和の合計です。データの変動全体を定量化します。

解釈

Minitabは調整平方和を使用して分散分析表のp値を計算します。また、平方和を使用してR2の統計量も計算します。通常は、平方和ではなく、p値とR2統計量を解釈します。

調整平均平方

調整平均平方は、項やモデルによってどれだけの変動を説明できるかを測定するものです。このとき、その他のすべての項は、入力された順序にかかわらずモデル内に含まれると仮定します。調整平方和と異なり、調整平均平方では、自由度が考慮されます。

調整平均平方誤差(MSEまたはs2)は適合値からの分散です。

解釈

Minitabは調整平均平方を使用して分散分析表のp値を計算します。また、調整平均平方を使用して調整済みR2の統計量も計算します。通常は、調整平均平方ではなく、p値と調整済みR2の統計量を解釈します。

F値

F値は分散分析表の各検定に表示されます。

モデルのF値
F値は、モデルに含まれるいずれかの項が応答に関連付けられているかを判断する検定統計量です。
因子項の種類のF値
F値は、項のグループが応答に関連付けられているかを判断する検定統計量です。項グループは例えば、線形効果や2次効果などです。
個々の項のF値
F値は項が応答に関連付けられているかを判断する検定統計量です。
不適合度検定におけるF値
F値は、モデルに対し、成分、プロセス変数、および量を実験に含む項を欠損しているかを判断する検定統計量です。ステップワイズ手順でモデルから項が削除される場合、不適合検定には、これらの項も含まれます。

解釈

F値を使用してMinitabで計算されるp値に基づいて、検定の統計的有意性に関する決定を下すことができます。p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。F値が十分に大きい場合、統計的有意性を示します。

F値から帰無仮説を棄却するかどうかを判断するには、F値を棄却限界値と比較します。Minitabで棄却限界値を計算することも、ほとんどの統計に関する書籍に掲載されているF分布表で棄却値を見つけることもできます。Minitabを使用した棄却値の計算に関する詳細は、逆累積分布関数(ICDF)の使用に進み、「ICDFを使用して棄却値を計算」をクリックします。

p値 – 回帰

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

モデルによって応答の変動を説明できるかどうかを判断するには、モデルのp値と有意水準を比較して帰無仮説を評価します。全体回帰の帰無仮説は、モデルでは応答の変動は説明できないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際にはモデルによって応答の変動は説明できないにも関わらず、説明できると結論付ける可能性が5%であることを示しています。
p値 ≤ α:モデルにより応答での変動が説明されます
p値が有意水準以下の場合は、そのモデルにより応答での変動が説明されると結論付けます。
p値 > α: 応答での変動はモデルによって説明されると結論付けるだけの十分な証拠はありません

p値が有意水準より大きい場合、そのモデルにより応答での変動が説明されると結論することはできません。新しいモデルを適合することができます。

p値~項と項グループ

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

成分間の依存により、混合実験におけるモデルの主効果に対するp値は表示されません。特に、成分の比率の合計は固定量や比率になる必要があるため、1つの成分を変更すると他の成分も変えざるをえなくなります。さらに、個別の成分項が切片項のような働きをするので、混合実験のモデルは切片項を持ちません。

解釈

分散分析表の項目が統計的に有意な場合、解釈は項目のタイプによって異なります。解釈は以下のとおりです。
  • 成分のみを含む交互作用項が統計的に有意な場合、成分の配合と応答の関係は統計的に有意であると結論付けることができます。
  • 成分とプロセス変数を含む交互作用項が統計的に有意な場合、応答変数に対する成分の効果はプロセス変数によって異なると結論付けることができます。
  • 項のグループが統計的に有意な場合、グループ内の少なくとも1つの項が応答に対して効果を持つと結論付けることができます。モデルに残す項を統計的有意性によって決定する場合、通常は一度に項のグループ全体を取り除くことはしません。個々の項の統計的有意性は、モデルに含まれる項によって変わることがあるためです。

p値 - 不適合度

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。Minitabでは、同じx値を持つ複数の観測値である反復がデータに含まれている場合に純粋誤差不適合検定が自動的に実行されます。反復は、「純粋誤差」を表します。これは、ランダム変動だけが複数の応答観測値の差を引き起こすためです。

解釈

モデルによって応答と予測の関係が正しく指定されるかどうかを判断するには、不適合度検定のp値と有意水準を比較して帰無仮説を評価します。不適合度検定の帰無仮説は、モデルによって応答と予測の関係が正しく指定されるという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際にはモデルによって応答と予測の関係が正しく指定されるのにも関わらず、正しく指定されないと結論付ける可能性が5%であることを示しています。
p値 ≤ α:その不適合は統計的に有意です
p値が有意水準以下の場合は、そのモデルでは関係が正しく指定されないと結論付けます。モデルを改善するには、項を追加するか、またはデータを変換する必要があります。
p値 > α:その不適合は統計的に有意ではありません

p値が有意水準より大きい場合は、検定で不適合が何も検出されません。