応答曲面計画を分析の係数表

係数表のすべての統計量の定義と解釈について解説します。

係数

係数は、モデル内の項と応答変数の関係の大きさと方向を表します。項間の多重共線性を最小限に抑えるために、係数はすべてコード化単位になっています。

解釈

項の係数は、その項のコード化単位1つ分の増加に関連付けられた平均応答の変化を表し、他の全ての項は固定されます。相関係数の符号は項と応答変数の関係の方向を示します。

係数の標準誤差(SE Coef)

係数の標準誤差により、同じ母集団から繰り返しサンプルを抽出する場合に得られる係数推定値間の変動を推定します。計算では、サンプルを繰り返し抽出する場合は実験計画と係数の推定値は変わらないと仮定します。

解釈

係数の標準誤差は、係数の推定値の精度を測定するために使用します。標準誤差が小さいほど、推定値の精度が高くなります。係数を標準誤差で割ったものがt値です。t統計量と関連付けられたp値が有意水準以下の場合、係数は統計的に有意であると結論付けることができます。

係数の信頼区間(95%信頼区間)

これらの信頼区間は、モデルにおける各項に対する係数の真の値を含む可能性が高い値の幅です。

データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、ランダムなサンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。

信頼区間は、次の2つの部分で構成されています。
点推定
この単一値は、サンプルデータを使用して母数を推定するためのものです。信頼区間は、点推定を中心にして得られます。
誤差幅
誤差幅は、信頼区間の幅を定義し、サンプル、サンプルサイズ、信頼水準において観測された変動性によって決定します。信頼区間の上限を計算するには、誤差幅を点推定に加算します。信頼区間の下限を計算するには、点推定から誤差幅を減算します。

解釈

信頼区間を使用して、モデルの各項の母集団係数の推定値を評価します。

たとえば、信頼水準が95%の場合、信頼区間に母集団の係数の値が含まれていることが95%信頼できます。信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。

t値

t値は、係数とその標準誤差の間の比率を測定します。

解釈

t値を使用してMinitabで計算されるp値に基づいて、係数が0と有意に異なるかどうかを検定することができます。

t値を使用して、帰無仮説を棄却するかどうかを判断できます。ただし、帰無仮説棄却のしきい値は自由度に依存しないため、p値が使用される頻度は高まります。t値に関する詳細については、t値を使用して、帰無仮説を棄却するかどうかを判断するを参照してください。

p値~係数

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

係数が0と異なるかどうかを判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、係数は0に等しく、項と応答に関連性がないという仮定です。

通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には係数は0であるにも関わらず、0ではないと結論付けるリスクが5%であることを示しています。

p値 ≤ α:関連性は統計的に有意です
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α: その関連性は統計的に有意ではありません
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論することはできません。項のないモデルを再適合したいと思うかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。
係数が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は以下のとおりです。
1次項
線形項の係数が統計的に有意な場合、因子の係数は0ではないと結論付けることができます。
因子間の交互作用
交互作用の係数が統計的に有意な場合は、因子と応答の間の関係がその項の他の因子に依存すると結論付けることができます。
2次項
2次項の係数が統計的に有意な場合、応答曲面に曲線が含まれると結論付けることができます。
ブロック
ブロックの係数が統計的に有意な場合は、ブロックに含まれる応答の平均値は応答の全体平均と異なると結論付けることができます。

分散拡大係数(VIF)

分散拡大要因(VIF: Variance Inflation Factor)は、モデルの予測変数間の相関が、回帰係数の分散をどのくらい増大させるかを示しています。

解釈

モデルにおいて、どれくらい多重共線性(予測変数間の相関)が存在するかを表すのに分散拡大要因(VIF)使います。多重共線性がないことで、統計的有意性の決定が簡単になります。データ収集時の不備のある実行は、VIF値が大きくなる一般的な理由で、これにより統計的有意性の解釈が複雑化します。以下のガイドラインに従ってVIFを解釈します。

分散拡大係数(VIF) 予測変数ステータス
VIF = 1 相関なし
1 < VIF < 5 穏やかに相関
VIF > 5 強く相関
多重共線性により回帰係数の分散は上昇するので、相関が高い予測変数には問題があります。係数が不安定になると次のような影響が生じます。
  • 係数は、予測変数と応答の間に重要な関係が存在する場合でも、統計的に有意でなく見える場合があります。
  • 相関の高い予測変数の係数がサンプルによって大きく異なります。
  • モデルから相関の高い項のいずれかを削除すると、他の相関の高い項の係数の推定値に大きな影響を及ぼします。相関の高い項の係数の符号が誤っている場合もあります。

統計的有意性を使用して、多重共線性のあるモデルから項を削除するときは注意が必要です。モデルから項を1つずつ追加・削除します。モデルを変更するときは、統計的有意性の検定とモデル要約統計量の変化を監視します。