2値ロジスティックモデルの当てはめ2値ロジスティック回帰の オッズ比

オッズ比は、2つのイベントのオッズを比較し、予測変数の影響を理解するのに役立ちます。オッズ比の解釈は、予測変数がカテゴリ変数か連続変数かによって異なります。また、オッズ比の信頼区間は、結果の実際的な有意性を評価するのに役立ちます。

オッズ比

オッズ比は、2つの事象のオッズを比較します。事象のオッズは、事象が発生する確率を事象が発生しない確率で除算するものです。 Minitabでは、モデルがlogitリンク関数を使用する場合にオッズ比を計算します。

解釈

オッズ比を使用して、予測変数の影響を理解します。オッズ比の解釈は、予測変数がカテゴリ変数か連続変数かによって変わります。

連続予測変数のオッズ比

オッズ比が1より大きい場合、予測変数が増加するにつれて事象が発生する可能性が高くなることを示します。オッズ比が1未満の場合、予測変数が増加するにつれて事象が発生する可能性が低くなることを示します。

これらの結果では、モデルは薬剤の用量を使用して、成人のバクテリアの有無を予測します。この例では、バクテリアのないことが事象です。それぞれの錠剤に0.5mgの用量が含まれ、研究者は0.5mgの単位の変化を使用します。オッズ比はおよそ6です。

連続予測変数のオッズ比

変更ユニットオッズ比95%信頼区間
投薬量(mg)0.56.1279(1.7218, 21.8087)
カテゴリ予測変数のオッズ比

カテゴリ変数の場合、オッズ比は、予測変数の2つの異なる水準に出現する事象のオッズを比較します。水準Aと水準Bの2つの列に水準を登録することによって比較を設定できます。水準Bは因子の参照水準です。オッズ比が1より大きい場合、事象は水準Aになる可能性が高くなることを示します。オッズ比が1未満の場合、事象は水準Aになる可能性が低くなることを示します。カテゴリ予測変数のコーディングに関する詳細はカテゴリ予測変数のコード化方式を参照してください。

この結果では、カテゴリ予測変数はホテルの繁忙期の開始月です。応答は、宿泊客が予約をキャンセルするかどうかです。この例ではキャンセルは事象です。最大オッズ比は7.71で、水準Aが4か月目のときと水準Bが1か月目のときが当てはまります。これは、宿泊客が4か月目に予約をキャンセルするオッズは、宿泊客が1か月目に予約をキャンセルするオッズよりも約8倍高いことを示しています。

2値ロジスティック回帰:Cancellation 対 月

カテゴリ予測変数のオッズ比

水準A水準Bオッズ比95%信頼区間
     
  211.1250(0.0600, 21.0834)
  313.3750(0.2897, 39.3165)
  417.7143(0.7461, 79.7592)
  512.2500(0.1107, 45.7172)
  616.0000(0.5322, 67.6397)
  323.0000(0.2547, 35.3325)
  426.8571(0.6556, 71.7169)
  522.0000(0.0976, 41.0019)
  625.3333(0.4679, 60.7946)
  432.2857(0.4103, 12.7323)
  530.6667(0.0514, 8.6389)
  631.7778(0.2842, 11.1200)
  540.2917(0.0252, 3.3719)
  640.7778(0.1464, 4.1326)
  652.6667(0.2124, 33.4861)
水準Bと比べた水準Aのオッズ比

オッズ比の信頼区間(95% CI)

信頼区間(CI)は、オッズ比の真の値が含まれている可能性のある値の範囲です。信頼区間の計算では、正規分布を使用します。標本のオッズ比の分布が正規分布に基づくようになるほどサンプルサイズが大きい場合、信頼区間は正確です。

データのサンプルはランダムであるため、1つの母集団からの2つのサンプルの信頼区間が同一である可能性は低くなります。しかし、ランダムなサンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。

信頼区間は、次の2つの部分で構成されています。
点推定
点推定は、サンプルデータから算出されるパラメータの推定値です。
誤差幅
誤差幅は信頼区間の幅を定義し、事象確率やサンプルサイズ、信頼水準の影響を受けます。

解釈

信頼区間を使用すると、オッズ比のパラメータの推定値を評価できます。

たとえば、信頼水準が95%の場合、信頼区間に母集団のオッズ比の値が含まれていることが95%信頼できます。信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルサイズを増加させることを検討します。