2値ロジスティックモデルの当てはめの主要な結果を解釈する

2値ロジスティックモデルを解釈するには、次の手順を実行します。主要な出力は、p値、係数、R2、適合度検定です。

ステップ1:モデルにおける応答と項の間の関係が統計的に有意かどうか判断する

モデルにおける応答と各項の間の関係が統計的に有意かどうか判断するには、項のp値と有意水準を比較して帰無仮説を評価します。この帰無仮説は、項と応答に関連性がないという仮定です。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には関連性がない場合でも、関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:関連性は統計的に有意である
p値が有意水準以下の場合は、応答変数と項の間に統計的に有意な関連性が存在すると結論付けることができます。
p値 > α:その関連性は統計的に有意ではない
p値が有意水準より大きい場合は、応答変数と項の間に統計的に有意な関連性があると結論することはできません。項を持たないモデルを再適合したいと考えるかもしれません。
応答との間に統計的に有意な関連性がない予測変数が複数存在する場合は、一度に1つずつ項を削除することによってモデルを縮約できます。モデルからの項の削除の詳細は、モデルの縮約化を参照してください。
モデル項が統計的に有意な場合、解釈は項のタイプによって異なります。解釈は以下のとおりです。
  • 連続予測変数が有意な場合、予測変数の係数は0ではないと結論できます。
  • カテゴリ予測変数が有意である場合、全ての因子水準が同じ確率を持つわけではないと結論できます。
  • 交互作用項が有意な場合は、予測変数と事象確率の関係がその項の他の予測変数に依存すると結論できます。
  • 多項式の項が有意な場合は、予測変数と事象確率の関係がその予測変数の重要度に依存すると結論付けることができます。

分散分析



ワルド検定
要因自由度カイ二乗p値
回帰17.830.005
  投薬量(mg)17.830.005

係数

係数係数の標準誤差Z-値p値VIF
定数-5.251.99-2.640.008 
投薬量(mg)3.631.302.800.0051.00
主要な結果:p値、係数

これらの結果では、投与量は、0.05の有意水準で統計的に有意になります。投与量の変化は、事象が起こる確率の変化と関係があると結論できます。

係数を評価して、予測変数の変化が事象が発生する可能性が高いか低いかを判断します。係数と確率の関係は、リンク関数を含む分析の方法によって変わります。一般に、係数が正の場合、予測変数が増加するにつれて事象の可能性は高くなることを示します。係数が負の場合、予測変数が増加するにつれて、事象の可能性は低くなることを示します。詳細は、2値ロジスティックモデルの当てはめの係数表と回帰式を参照してください。

投薬量の係数は3.63であり、投薬量が多くなるほど事象が起こる確率が高くなるという関係にあります。

交互作用項が統計的に有意な場合、予測変数と応答の関係は他の予測変数の水準で変わります。こうしたケースでは、交互作用の影響の考慮なしに主効果を解釈すべきではありません。モデルの主要な影響、交互作用の影響、および曲率をより理解するには、要因プロット応答の最適化機能を参照してください。

ステップ2:予測変数の効果を理解する

オッズ比を使用して、予測変数の影響を理解します。オッズ比の解釈は、予測変数がカテゴリ変数か連続変数かによって変わります。Minitabでは、モデルがlogitリンク関数を使用する場合にオッズ比を計算します。
連続予測変数のオッズ比

オッズ比が1より大きい場合、予測変数が増加するにつれて事象が発生する可能性が高くなることを示しています。オッズ比が1未満の場合、予測変数が増加するにつれて事象が発生する可能性が低くなることを示しています。

連続予測変数のオッズ比

変更ユニットオッズ比95%信頼区間
投薬量(mg)0.56.1279(1.7218, 21.8087)
主要な結果:オッズ比

これらの結果では、モデルは薬剤の用量を使用して、成人のバクテリアの有無を予測します。この例では、バクテリアのないことが事象です。それぞれの錠剤に0.5mgの用量が含まれ、研究者は0.5mgの単位の変化を使用します。オッズ比はおよそ6です。成人が錠剤を1錠ずつ増やすたびに、患者にバクテリアのないオッズが約6倍ずつ高まります。

カテゴリ予測変数のオッズ比

カテゴリ予測変数では、オッズ比が予測変数の異なる2水準で発生する事象のオッズを比較します。Minitabでは、水準A、水準Bが、2列に入力され、比較の設定が行われます。水準Bは、因子の参照水準です。1より大きいオッズ比は、事象が水準Aである可能性が高いことを示します。1より小さいオッズ比は、事象が水準Aである可能性が低いことを示します。カテゴリ予測変数のコード化に関する詳細は、カテゴリ予測変数のコード化方式を参照してください。

2値ロジスティック回帰:Cancellation 対 月

カテゴリ予測変数のオッズ比

水準A水準Bオッズ比95%信頼区間
     
  211.1250(0.0600, 21.0834)
  313.3750(0.2897, 39.3165)
  417.7143(0.7461, 79.7592)
  512.2500(0.1107, 45.7172)
  616.0000(0.5322, 67.6397)
  323.0000(0.2547, 35.3325)
  426.8571(0.6556, 71.7169)
  522.0000(0.0976, 41.0019)
  625.3333(0.4679, 60.7946)
  432.2857(0.4103, 12.7323)
  530.6667(0.0514, 8.6389)
  631.7778(0.2842, 11.1200)
  540.2917(0.0252, 3.3719)
  640.7778(0.1464, 4.1326)
  652.6667(0.2124, 33.4861)
水準Bと比べた水準Aのオッズ比
主要な結果:オッズ比

これらの結果では、カテゴリ予測変数はホテルの繁忙期に入った月です。応答は、宿泊客が予約をキャンセルするかどうかです。この例では、キャンセルは事象です。水準Aが月4、水準Bが月1の時、最大のオッズ比はおよそ7.71です。これは、宿泊客が月4で予約をキャンセルするオッズは、月1で予約をキャンセルするオッズのおよそ8倍だということを示しています。

詳細は2値ロジスティックモデルの当てはめのオッズ比を参照してください。

ステップ3:データに対するモデルの適合度を判断します

どの程度モデルがデータに適合するかを判断するには、モデル要約表の統計量を調べます。

モデル要約統計量と適合度統計量の多くは、データがワークシートでどのように配置されているか、行あたりで1回の試行なのか複数の試行なのか、の影響を受けます。ホスマー-レメショウ検定は、データのフォーマットの影響を受けず、フォーマット間で比較可能です。詳細は、データフォーマットが2値ロジスティック回帰の適合値に与える影響を参照してください。

逸脱度R二乗

逸脱R2値が大きくなるほど、データへのモデル適合度は向上します。逸脱R2は常に0%から100%の間の値になります。

逸脱R2はモデルに新しい予測変数を追加すると常に大きくなります。たとえば、最適な5つの予測変数のモデルのR2は、必ず最適な4つの予測変数のモデルと少なくとも同じ大きさになります。したがって、逸脱R2は同じ大きさのモデルの比較に最も便利です。

2値ロジスティック回帰では、データのフォーマットは逸脱R2値に影響します。逸脱R2は、通常、事象・試行フォーマットの場合に高くなります。逸脱R2値は、同じデータフォーマットのモデル間でのみ比較可能です。

適合度統計量は、データに対するモデルの適合度を測る1つの測度に過ぎません。モデルの値が望ましい場合でも残差プロットと適合度検定を確認してデータに対するモデルの適合度を評価する必要があります。

逸脱度R二乗(調整済み)

異なる数の予測変数をもつモデルを比較する場合は、調整済み逸脱R2を使用します。逸脱R2はモデルに予測変数を追加すると必ず大きくなります。調整済み逸脱R2値にはモデルに含まれる予測変数の数が組み入れられるため、正しいモデルの選択に役立ちます。

AIC、AICc、BIC

異なるモデルを比較する際はAIC、AICc、BICを使用します。どちらの統計量でも、小さい値が好ましいと考えられます。ただし、予測変数セットに対して最小値を持つモデルは必ずしもデータに良好に適合しません。適合度検定と残差プロットも使用して、データに対するモデルの適合度を評価してください。

ROC曲線下面積

ROC曲線下の面積の値の範囲は0.5から1です。2値モデルがクラスを完全に分類できる場合、曲線下の面積は1になります。2値モデルがランダムな割り当てよりも良くクラスを分類できない場合、曲線下の面積は0.5になります。

モデル要約

逸脱
(deviance)
R二乗
逸脱
(deviance)
R二乗 (調整済み)
AICAICc(修正済み
赤池情報量基準)
BIC(ベイズ
情報量基準)
ROC曲線下面積
96.04%91.81%10.6314.6310.220.9398
主要な結果:逸脱R二乗、逸脱R二乗(調整済み)、AIC、ROC曲線下の面積

これらの結果を基に、モデルは、応答変数における総変動のおよそ96.04%を説明づけます。これらのデータに関して、この逸脱R2値はモデルが良好に適合していることを示します。ROC曲線下の面積は0.9398です。この値は、モデルがデータの多くを正しく分類することを示します。追加的なモデルが異なる予測変数と適合する場合は、調整済み逸脱R2値、AIC値、AICc値、BIC値、ROC曲線下の面積を使用して、どれほどモデルがデータに適合しているかを比較します。

ステップ4: データに適合しないモデルかどうかを判断する

適合度検定を使用し、二項分布が予測できない方法で、予測される確率が観測される確率から離れた値であるかを判断します。適合度検定のp値が、選択した有意水準よりも低い場合、二項分布が予測できないように、予測確率が観測確率から逸脱した値になります。逸脱の一般的な原因は次の通りです。
  • 不適切なリンク関数
  • モデル内にある変数の高次項が省略されています
  • モデル内にはない予測変数が省略されています
  • 過分散

逸脱度が統計的に有意な場合、別のリンク関数を実行、あるいはモデル内の項を変更できます。

2値ロジスティック回帰では、データのフォーマットは各行ごとの試行の回数が変わるため、p値に影響を及ぼします。

  • 逸脱度: データフォーマットが2値応答・度数の場合、データフォーマットが事象・試行の場合に比べて逸脱検定のp値が低くなる傾向にあります。データフォーマットが2値応答・度数の場合は、ホスマー-レメショウ検定の結果の信頼度がより高くなります。
  • ピアソン: ピアソン検定で使用する近似カイ二乗分布は、データに含まれる行ごとの事象の期待数が小さい場合は不正確になります。それゆえ、データのフォーマットが2値応答・度数の場合のピアソンの適合度検定は不正確となります。
  • ホスマー-レメショウ: ホスマー-レメショウ検定は他の適合度検定のように、データ内の行ごとの試行回数にも左右されません。データの各行の試行回数がほとんどない場合、ホスマー-レメショウ検定は、データに対するモデルの適合度を示す指標として、信頼度が高まります。

応答情報

変数計数事象名
事象事象160事象
  非事象340 
試行合計500 

適合度検定

検定自由度カイ二乗p値
逸脱 (deviance)23.780.151
ピアソン23.760.152
Hosmer-Lemeshow33.760.288
事象・試行フォーマットの主要な結果: 応答情報、逸脱度検定、ピアソン検定、ホスマー-レメショウ検定

これらの結果では、応答情報表は変数列の事象と試行を表示します。これらのラベルは、データが事象・試行フォーマットにあることを示します。すべての適合度検定のp値は、通常の有意水準である0.05よりも大きいです。この検定は、二項分布が予測できないように、予測される確率が観測される確率から離れた値になることを示す根拠にはなりません。

応答情報

変数計数
Y事象160(事象)
  非事象340 
  合計500 

適合度検定

検定自由度カイ二乗p値
逸脱 (deviance)497552.030.044
ピアソン497504.420.399
Hosmer-Lemeshow33.760.288
2値応答・度数フォーマットの主要な結果: 応答情報、逸脱度検定、ピアソン検定、ホスマー-レメショウ検定

これらの結果のデータが同じ場合、応答情報表は変数列のYを表示します。このラベルは、データが2値応答・度数フォーマットであることを示します。逸脱度検定のp値は通常の有意水準である0.05よりも低くなりますが、ホスマー-レメショウ検定は最も信頼できる検定です。ホスマー-レメショウ検定は、二項分布が予測できないように、予測される確率が観測される確率から離れた値になることを示す根拠にはなりません。