適合ポアソンモデルの主要な結果を解釈する

ポアソン回帰モデルを解釈するには、次の手順を実行します。主要な出力値には、p値、係数、モデル要約統計量、残差プロットがあります。

ステップ1: 応答と項の間の関係が統計的に有意かどうか判断する

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項と応答に関連性がないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意です
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α:その関連性は統計的に有意ではありません
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論付けることはできません。項を持たないモデルを再適合したいと考えるかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。
モデル項が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は次のとおりです。
  • 連続予測変数が有意な場合、予測変数の係数は0ではないと結論できます。
  • カテゴリ予測変数が有意である場合、全ての水準が同じ平均事象数を持つわけではないと結論できます。
  • 交互作用項が有意な場合は、予測変数と事象数の間の関係が、その項の他の予測変数に依存すると結論できます。
  • 多項式項が有意な場合は、予測変数と事象数の関係が、予測変数の大きさに依存すると結論できます。
逸脱 (deviance)表 要因 自由度 調整偏差 調整平均 カイ二乗 p値 回帰 3 56.670 18.8900 56.67 0.000 洗浄後の経過時間 1 4.744 4.7444 4.74 0.029 温度 1 38.800 38.8000 38.80 0.000 ねじのサイズ 1 13.126 13.1256 13.13 0.000 誤差 32 31.607 0.9877 合計 35 88.277
係数 係数の標 項 係数 準誤差 VIF 定数 4.2436 0.0639 洗浄後の経過時間 0.01798 0.00826 1.00 温度 -0.001974 0.000318 1.00 ねじのサイズ 大 0.1546 0.0427 1.00
主要な結果: p値、係数

これらの結果では、3つの予測変数はすべて統計的に有意な0.05の水準です。この変数の変化量は応答変数の変化量と関係していると結論付けることができます。

係数を使い、予測変数の変化が事象が発生する確率に変化を与えるかどうかを判断します。予測変数の推定係数は、予測変数の1単位分の変化に対するリンク関数の変化を表し、モデルの他のすべての予測変数は固定されます。係数と事象数の関係は、モデルに含まれるカテゴリ予測変数の参照水準やリンク関数などを含む分析のさまざまな側面に依存します。基本的に、正の係数は事象の発生確率を高くし、負の係数は低くします。推定係数が0に近いということは、予測変数の影響力は小さいか、存在しないことを示します。

カテゴリ予測変数の推定された係数は、予測変数の参照水準と比較して解釈します。正の係数は、その予測変数の水準での事象の確率の方が、因子の参照水準よりも高いと考えられることを示します。負の係数は、その予測変数の水準での事象の確率の方が、参照水準よりも低いと考えられることを示します。

洗浄後の経過時間(Hours Since Cleanse)の係数は正であり、時間が長いほど応答値が高くなるという関係を示しています。温度の係数は負であり、これは温度が高いほど応答値が低くなるという関係を示しています。

ねじのサイズは、1つの係数を持つカテゴリ変数であり、この変数には2つの水準があり、0、1のコード化を使用していることを示しています。小さなねじの係数は負であるため、小さなねじは、応答値が参照水準よりも低くなることと関係があります。

交互作用項が統計的に有意な場合、予測変数と応答の関係は他の予測変数の水準で変わります。このケースでは、交互作用の影響を考慮せずに主要な影響を解釈すべきではありません。モデルの主要な影響、交互作用の影響、および曲率を理解するには、要因プロット応答の最適化機能を参照してください。

ステップ2: データに適合しないモデルかどうかを判断する

適合度検定を使用して、ポアソン分布が予測できない方法で、予測される事象数が観測される事象数から逸脱しているかどうかを判断します。適合度検定のp値が選択した有意水準よりも低い場合、ポアソン分布によって適合値を導き出す帰無仮説を棄却できます。逸脱の一般的な原因は以下の通りです。
  • 不適切なリンク関数
  • モデル内にある変数の高次項が省略されています
  • モデル内にはない予測変数が省略されています
  • 過分散

逸脱度が統計的に有意な場合、別のリンク関数を実行、あるいはモデル内の項を変更できます。

適合度検定 検定 自由度 推定 平均 カイ二乗 p値 逸脱 (deviance) 32 31.60722 0.98773 31.61 0.486 ピアソン 32 31.26713 0.97710 31.27 0.503
主要な結果: 逸脱度検定、ピアソン検定

これらの結果において、適合度検定は両方とも、通常の有意水準である0.05よりも大きなp値になります。予測される事象数が観測される事象数から逸脱していると結論づけるには、根拠が不十分です。

ステップ3: データに対するモデルの適合度を判断する

異なるモデルを比較する際はAICを使用します。AICが小さいほどモデルのデータに対する適合度は上がります。しかし、予測変数セットに対してAICが最小であるモデルは、データに必ずしも良好に適合しません。適合度検定と残差プロットも使用し、データに対するモデルの適合度を評価してください。

モデル要約 逸脱 逸脱 (deviance) (deviance) R二乗 (調 R二乗 整済み) AIC 64.20% 60.80% 253.29
係数 係数の標 項 係数 準誤差 VIF 定数 4.2436 0.0639 洗浄後の経過時間 0.01798 0.00826 1.00 温度 -0.001974 0.000318 1.00 ねじのサイズ 大 0.1546 0.0427 1.00
主要な結果: 赤池情報量基準(AIC)

1組目の結果では、AICはおよそ253です。このモデルには、ねじの温度とサイズの交互作用は含まれていません。個々のAICモデルは、値がサンプルのサイズによって変わるため、モデルの善し悪しは示していません。

モデル要約 逸脱 逸脱 (deviance) (deviance) R二乗 (調 R二乗 整済み) AIC 85.99% 81.46% 236.05
係数 係数の標 項 係数 準誤差 VIF 定数 4.0317 0.0819 洗浄後の経過時間 0.01798 0.00826 1.00 温度 -0.000481 0.000465 2.13 ねじのサイズ 大 0.5444 0.0990 5.37 温度*ねじのサイズ 大 -0.002804 0.000640 6.07

2組目の結果では、AICはおよそ236です。このモデルには、ねじの温度とサイズの交互作用があります。AICが小さくなると、交互作用のあるモデルのパフォーマンスが良くなることを示しています。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください