安定性分析の係数表

係数表のすべての統計量の定義と解釈について解説します。

係数

回帰係数は、予測変数と応答変数の関係の、サイズと方向を表します。係数とは、回帰式において項の値に乗じられる数です。

解釈

各係数の解釈は、係数が時間の連続係数であるかバッチのカテゴリ係数であるかによって変わります。
時間
時間変数の係数は、時間の単位当たりの変化に対する平均応答の変化を表します。係数が負の場合、時間が経つにつれて応答の平均値が減少します。係数が正の場合、時間が経つにつれて、応答の平均値が増加します。
バッチ
係数は、バッチ因子の水準(1つの水準を除く)ごとにリスト化されます。「欠席」の水準はバッチ因子の参照水準です。各係数は、水準平均と参照水準平均の平均差を表します。

交互作用がある場合、係数の解釈は複雑になります。これらの結果では、品質技師は新しい薬品の保存期間を推定したいと考えます。バッチ1の係数が負の場合、バッチ1の薬品の効果は、バッチ6である参照水準の薬品よりも小さくなります。ただし、バッチ1のバッチ交互作用による「月」の係数は、正になります。時間効果はバッチによって変わるので、バッチ1とバッチ6の差は時系列で変化します。

係数

係数係数の標準誤差t値p値VIF
定数100.0850.143701.820.000 
-0.136330.00769-17.740.0001.07
バッチ         
  1-0.2320.292-0.800.4323.85
  20.0680.2920.230.8183.85
  30.3940.2751.430.1623.41
  4-0.3170.292-1.080.2873.85
  50.0880.2750.320.752*
月*バッチ         
  10.04540.01642.760.0104.52
  2-0.02410.0164-1.470.1524.52
  3-0.02670.0136-1.960.0603.65
  40.00140.01640.080.9354.52
  50.00400.01360.300.769*

係数の大きさは、応答変数に対して項が持つ影響力の実質的な有意性を評価するのに役立ちます。ただし、係数の大きさは項の統計的な有意性は示しません。これは有意性の計算には応答データの変動も考慮されるためです。統計的な有意性を判断するには、項のp値を調べます。

係数の標準誤差

係数の標準誤差は、サンプルデータによる係数の推定を元に不確実性を推定します。

解釈

係数の標準誤差は、係数の推定値の精度を測定するために使用します。標準誤差が小さいほど、推定値の精度が高くなります。係数を標準誤差で割ったものがt値です。t統計量と関係のあるp値が有意水準(アルファまたはαと表記)以下の場合、係数は統計的に有意であると結論付けることができます。

t値

t値は、係数とその標準誤差の間の比率を測定します。

解釈

t値を使用してMinitabで計算されるp値に基づいて、係数が0と有意に異なるかどうかを検定することができます。

t値を使用して、帰無仮説を棄却するかどうかを判断できます。ただし、帰無仮説棄却のしきい値は自由度に依存しないため、p値が使用される頻度は高まります。t値に関する詳細については、t値を使用して、帰無仮説を棄却するかどうかを判断するを参照してください。

p値…係数

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

安定性分析では、係数表には分析の有意水準より低いp値を持つ項しかありません。帰無仮説は、項の係数がゼロに等しいかどうかです。デフォルトの有意水準は0.25です。0.25の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが25%であるということを示します。

モデル項が統計的に有意な場合、解釈は項のタイプによって異なります。
  • 項が有意な場合、応答は時系列で変化します。
  • バッチが有意な場合、平均応答はバッチごとに異なります。
  • バッチ交互作用による時間が有意な場合、応答が時系列で変化する速度はバッチによって変わります。

係数の信頼区間(95%の信頼区間)

これらの信頼区間(CI)は、モデルにおける各項に対する係数の真の値を含む可能性が高い値の幅です。

データのサンプルはランダムであるため、1つの母集団からの2つのサンプルの信頼区間が同一である可能性は低くなります。しかし、ランダムなサンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。

信頼区間は、次の2つの部分で構成されています。
点推定
この単一値は、サンプルデータを使用して母数を推定するためのものです。信頼区間は、点推定を中心にして得られます。
誤差幅
誤差幅は、信頼区間の幅の定義に使用され、サンプル、サンプルサイズ、および信頼水準における観測された変動性によって決まります。信頼区間の上限を計算するには、誤差幅を点推定に加算します。信頼区間の下限を計算するには、点推定から誤差幅を減算します。

解釈

信頼区間を使用して、モデルの各項の母集団係数の推定値を評価します。

たとえば、信頼水準が95%の場合、信頼区間に母集団係数の値が含まれていることが95%信頼できます。信頼区間は、結果の実質的な有意性を評価するのに役立ちます。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて有用でない場合は、サンプルサイズを増やすことを検討します。

VIF

分散拡大要因(VIF: Variance Inflation Factor)は、モデルの予測変数間の相関が、回帰係数の分散をどのくらい増大させるかを示しています。

解釈

回帰分析において、どれくらい多重共線性(予測変数間の相関)が存在するかを表すのにVIFを使います。多重共線性は回帰係数の分散を増加させ、予測変数による応答変数への個々の影響力を評価するのが困難となる可能性があります。

以下のガイドラインに従ってVIFを解釈します。
VIF 予測変数ステータス
VIF = 1 相関なし
1 < VIF < 5 穏やかに相関
VIF > 5 強く相関
VIF値が5よりも大きい場合は、多重共線性が極端であるために回帰係数の推定精度が低いことを示しています。

多重共線性およびその影響の軽減方法についての詳細は、回帰における多重共線性を参照してください。