2値ロジスティックモデルの当てはめの例

あるシリアル会社のマーケティングコンサルタントが、新しいシリアル製品のテレビコマーシャルの効果を調査します。そこで、ある特定のコミュニティに対して1週間にわたって広告を放送します。その後、コンサルタントは地域のスーパーマーケットの出口で無作為に大人をサンプル抽出し、広告を見たかどうかと新しいシリアルを購入したかどうかを尋ねます。さらに子供がいるかどうかと年間世帯収入についても尋ねます。

応答は2値であるため、コンサルタントは、広告、子供の有無、年間世帯収入がシリアルを購入したかどうかにどのように関連するかを調べるために、2値ロジスティック回帰を使用します。

  1. 標本データを開く、 シリアルの購入.MTW.
  2. 統計 > 回帰 > 2値ロジスティック回帰 > 2値ロジスティックモデルの適合を選択します。
  3. ドロップダウンリストから、応答/度数フォーマットでの応答を選択します。
  4. 応答購入を入力します。
  5. 連続予測変数年収を入力します。
  6. カテゴリ予測変数に、子供広告視聴を入力します。
  7. オプションをクリックします。全区間の信頼水準90を入力します。
  8. 各ダイアログボックスでOKをクリックします。

結果を解釈する

分散分析表は、どの予測変数が応答との統計的に有意な関係を示します。定数は0.10の有意水準を使用し、結果は、予測変数「子ども」および「ViewAd」に、応答と統計的に有意な関係があることを示します。「収入」は、p値が0.10よりも大きいので、応答と統計的に有意な関係はありません。コンサルタントは、収入変数のないモデルを再適合したいと考えることがあります。

このオッズ比は、子を持つ大人がシリアルを購入する可能性が、子のいない大人よりも約4.2倍高いことを示しています。広告を見た大人のオッズ比は、広告を見なかった大人よりも、シリアルを購入する可能性が約2.8倍高いことを示しています。

適合度検定は、すべて0.05の有意水準を上回り、モデルがデータに適合しないと結論づける十分な根拠はないことを示しています。R2値は、モデルが応答における総逸脱のおよそ12.7%を説明していることを示しています。

方法

リンク関数Logit
カテゴリ予測変数のコーディング(1, 0)
使用中の行71

応答情報

変数計数
購入122(事象)
  049 
  合計71 

回帰式

P(1)=exp(Y')/(1 + exp(Y'))
子供広告視聴
いいえいいえY'=-3.016 + 0.01374 年収
         
いいえはいY'=-1.982 + 0.01374 年収
         
はいいいえY'=-1.583 + 0.01374 年収
         
はいはいY'=-0.5490 + 0.01374 年収

係数

係数係数の標準誤差Z-値p値VIF
定数-3.0160.939-3.210.001 
年収0.01370.01950.710.4811.15
子供         
  はい1.4330.8561.670.0941.12
広告視聴         
  はい1.0340.5721.810.0701.03

連続予測変数のオッズ比

オッズ比90%信頼区間
年収1.0138(0.9819, 1.0469)

カテゴリ予測変数のオッズ比

水準A水準Bオッズ比90%信頼区間
子供     
  はいいいえ4.1902(1.0245, 17.1386)
広告視聴     
  はいいいえ2.8128(1.0982, 7.2044)
水準Bと比べた水準Aのオッズ比

モデル要約

逸脱
(deviance)
R二乗
逸脱
(deviance)
R二乗 (調整済み)
AICAICc(修正済み
赤池情報量基準)
BIC(ベイズ
情報量基準)
ROC曲線下面積
12.66%9.25%84.7785.3793.820.7333

適合度検定

検定自由度カイ二乗p値
逸脱 (deviance)6776.770.194
ピアソン6776.110.209
Hosmer-Lemeshow85.580.694

分散分析



ワルド検定
要因自由度カイ二乗p値
回帰38.790.032
  年収10.500.481
  子供12.800.094
  広告視聴13.270.070

異常な観測値の適合値と診断

観測値観測された確率適合値残差標準化残差
501.0000.0622.3572.40R
681.0000.0912.1892.28R
R  大きな残差