ポアソンモデルの当てはめの主要な結果を解釈する

ポアソン回帰モデルを解釈するには、次の手順を実行します。主要な出力値には、p値、係数、モデル要約統計量、残差プロットがあります。

ステップ1:モデルにおける応答と項の間の関係が統計的に有意かどうか判断する

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項と応答に関連性がないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意である
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α:その関連性は統計的に有意ではない
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論することはできません。項を持たないモデルを再適合したいと考えるかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。
モデル項が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は以下のとおりです。
  • 連続予測変数が有意な場合、予測変数の係数は0ではないと結論できます。
  • カテゴリ予測変数が有意である場合、全ての水準が同じ平均事象数を持つわけではないと結論できます。
  • 交互作用項が有意な場合は、予測変数と事象数の間の関係が、その項の他の予測変数に依存すると結論できます。
  • 多項式項が有意な場合は、予測変数と事象数の関係が、予測変数の大きさに依存すると結論できます。

分散分析



ワルド検定
要因自由度カイ二乗p値
回帰356.290.000
  洗浄後の経過時間14.740.029
  温度138.460.000
  ねじのサイズ113.090.000

係数

係数係数の標準誤差Z-値p値VIF
定数4.39820.062870.020.000 
洗浄後の経過時間0.017980.008262.180.0291.00
温度-0.0019740.000318-6.200.0001.00
ねじのサイズ         
  小-0.15460.0427-3.620.0001.00
主要な結果:p値、係数

この結果では、3つのすべての予測変数は水準0.05のときに統計的に有意になります。この結果から、これらの変数の変化は応答変数の変化に関連付けられていると結論付けることができます。

予測変数の変化により事象が発生する可能性が高くなるか低くなるかを特定するには係数を使います。予測変数の推定係数は、予測変数の1単位分の変化に対するリンク関数の変化を表し、モデル内の他の予測変数は固定されます。係数と事象数の関係は、モデルに含まれるカテゴリ予測変数の参照水準やリンク関数などを含む分析のさまざまな側面に依存します。一般的に係数が正数の場合は事象が発生する可能性が高く、負数の場合は低くなります。推定係数が0に近いということは、予測変数の影響力は小さいか、存在しないことを示します。

カテゴリ予測変数の推定された係数は、予測変数の参照水準と比較して解釈します。正の係数は、事象が起こる可能性が、因子の参照水準よりも予測変数の水準の方が大きいことを示します。負の係数は、事象が起こる可能性が、参照水準よりも予測変数の水準の方が小さいことを示します。

洗浄後の経過時間(Hours Since Cleanse)の係数は正であり、時間が長いほど応答値が高くなるという関係を示しています。温度の係数は負であり、これは温度が高いほど応答値が低くなるという関係を示しています。

ねじのサイズは、1つの係数を持つカテゴリ変数であり、この変数には2つの水準があり、0、1のコード化を使用していることを示しています。小さなねじの係数は負であるため、小さなねじは、応答値が参照水準よりも低くなることと関係があります。

交互作用項が統計的に有意な場合、予測変数と応答の関係は他の予測変数の水準で変わります。こうしたケースでは、交互作用の影響の考慮なしに主効果を解釈すべきではありません。モデルの主要な影響、交互作用の影響、および曲率をより理解するには、要因プロット応答の最適化機能を参照してください。

ステップ2: データに適合しないモデルかどうかを判断する

適合度検定を使用して、ポアソン分布が予測できない方法で、予測される事象数が観測される事象数から逸脱しているかどうかを判断します。適合度検定のp値が選択した有意水準よりも低い場合、ポアソン分布によって適合値を導き出す帰無仮説を棄却できます。逸脱の一般的な原因は以下の通りです。
  • 不適切なリンク関数
  • モデル内にある変数の高次項が省略されています
  • モデル内にはない予測変数が省略されています
  • 過分散

逸脱度が統計的に有意な場合、別のリンク関数を実行、あるいはモデル内の項を変更できます。

適合度検定

検定自由度推定平均カイ二乗p値
逸脱 (deviance)3231.607220.9877331.610.486
ピアソン3231.267130.9771031.270.503
主要な結果: 逸脱度検定、ピアソン検定

これらの結果 において、適合度検定は両方とも、通常の有意水準である0.05よりも大きなp値になります。予測事象数が観測事象数から逸脱していると結論づけるには、根拠が不十分です。

ステップ3:データに対するモデルの適合度を判断する

異なるモデルを比較する際はAIC、AICc、BICを使用します。いずれの統計量でも、小さい値が好ましいと考えられます。ただし、予測変数セットに対して最小値を持つモデルは必ずしもデータに良好に適合しません。適合度検定と残差プロットも使用して、データに対するモデルの適合度を評価してください。

モデル要約

逸脱
(deviance)
R二乗
逸脱
(deviance)
R二乗 (調整済み)
AICAICc(修正済み
赤池情報量基準)
BIC(ベイズ
情報量基準)
64.20%60.80%253.29254.58259.62

係数

係数係数の標準誤差Z-値p値VIF
定数4.39820.062870.020.000 
洗浄後の経過時間0.017980.008262.180.0291.00
温度-0.0019740.000318-6.200.0001.00
ねじのサイズ         
  小-0.15460.0427-3.620.0001.00
主要な結果:赤池情報量基準(AIC)

1組目の結果では、AICはおよそ253です。AICcはおよそ255です。BICはおよそ260です。このモデルには、ねじの温度とサイズの交互作用は含まれません。個別モデルの情報基準では、サンプルサイズによって値が異なるため、モデルのデータ適合度は表示されません。

モデル要約

逸脱
(deviance)
R二乗
逸脱
(deviance)
R二乗 (調整済み)
AICAICc(修正済み
赤池情報量基準)
BIC(ベイズ
情報量基準)
85.99%81.46%236.05238.05243.97

係数

係数係数の標準誤差Z-値p値VIF
定数4.57600.073662.150.000 
洗浄後の経過時間0.017980.008262.180.0291.00
温度-0.0032850.000441-7.460.0001.92
ねじのサイズ         
  小-0.54440.0990-5.500.0005.37
温度*ねじのサイズ         
  小0.0028040.0006404.380.0006.64

2組目の結果では、AICはおよそ236です。AICcはおよそ238です。BICはおよそ244です。このモデルには、ねじの温度とサイズの交互作用があります。値が小さくなると、交互作用のあるモデルのパフォーマンスが良くなることを示しています。