이항 로지스틱 모형 적합

한 시리얼 회사의 마케팅 컨설턴트가 새로운 시리얼 제품에 대한 TV 광고의 효과를 조사합니다. 이 컨설턴트는 특정 지역에 1주 간 광고를 내보냅니다. 그런 다음 해당 지역의 슈퍼마켓에서 나오는 어른들을 랜덤하게 선택하여 광고를 보고 새 시리얼을 구입했는지 물어봅니다. 컨설턴트는 자녀가 있는지 그리고 연간 가구 수입도 함께 물어 봅니다.

반응이 이항이기 때문에, 컨설턴트는 이항 로지스틱 회귀 분석을 사용하여 광고, 자녀 유무 및 연간 가구 수입이 시리얼 구입 여부와 어떤 관련이 있는지 확인합니다.

  1. 표본 데이터를 엽니다 시리얼구입.MTW.
  2. 통계분석 > 회귀 분석 > 이항 로지스틱 회귀 분석 > 이항 로지스틱 모형 적합을 선택합니다.
  3. 드롭다운 리스트에서 이항 반응/빈도 형식의 반응을 선택합니다.
  4. 반응 변수구입을 입력합니다.
  5. 계량형 예측 변수수입을 입력합니다.
  6. 범주형 예측 변수자녀광고 시청을 입력합니다.
  7. 옵션을(를) 클릭합니다. 모든 구간에 대한 신뢰 수준 아래에 90을 입력합니다.
  8. 각 대화 상자에서 확인을 클릭합니다.

결과 해석

분산 분석표는 어느 예측 변수가 반응과 통계적으로 유의한 관계를 가지고 있는지 보여줍니다. 컨설턴트는 0.10의 유의 수준을 사용하며 결과는 예측 변수인 자녀와 광고 시청이 반응과 통계적으로 유의한 관계를 가지고 있다는 것을 나타냅니다. 수입은 p-값이 0.10보다 크기 때문에 반응과 통계적으로 유의한 관계를 가지고 있지 않습니다. 컨설턴트는 수입 변수 없이 모형을 다시 적합할 수도 있습니다.

승산비는 자녀가 있는 어른이 자녀가 없는 어른보다 시리얼을 구입할 가능성이 약 4.2배 더 높다는 것을 나타냅니다. 광고를 시청한 어른에 대한 승산비는 이들이 광고를 시청하지 않은 어른보다 시리얼을 구입할 가능성이 약 2.8배 더 높다는 것을 나타냅니다.

적합도 검정은 모두 유의 수준 0.05보다 크고, 이는 모형이 데이터를 적합하지 않는다는 결론을 내릴 수 있는 충분한 증거가 없다는 것을 나타냅니다. R2 값은 모형이 반응의 이탈도를 약 12.7% 설명한다는 것을 나타냅니다.

방법

연결 함수로짓
범주형 예측 변수 코드화(1, 0)
사용된 행71

반응 정보

변수카운트
구입122(사건)
  049 
  총계71 

회귀 방정식

P(1)=exp(Y')/(1 + exp(Y'))
자녀광고 시청
아니요아니요Y'=-3.016 + 0.01374 수입
         
아니요Y'=-1.982 + 0.01374 수입
         
아니요Y'=-1.583 + 0.01374 수입
         
Y'=-0.5490 + 0.01374 수입

계수

계수SE 계수Z-값P-값VIF
상수-3.0160.939-3.210.001 
수입0.01370.01950.710.4811.15
자녀         
  예1.4330.8561.670.0941.12
광고 시청         
  예1.0340.5721.810.0701.03

계량형 예측 변수에 대한 승산비

승산비90% CI
수입1.0138(0.9819, 1.0469)

범주형 예측 변수에 대한 승산비

수준 A수준 B승산비90% CI
자녀     
  예아니요4.1902(1.0245, 17.1386)
광고 시청     
  예아니요2.8128(1.0982, 7.2044)
수준 B에 상대적인 수준 A에 대한 승산비

모형 요약

이탈도 R-Sq이탈도 R-Sq(수정)AICAICcBICROC 곡선 아래 면적
12.66%9.25%84.7785.3793.820.7333

적합도 검정

검정DF카이-제곱P-값
이탈도6776.770.194
Pearson6776.110.209
Hosmer-Lemeshow85.580.694

분산 분석



Wald 검정
출처DF카이-제곱P-값
회귀38.790.032
  수입10.500.481
  자녀12.800.094
  광고 시청13.270.070

비정상적 관측치에 대한 적합치 및 진단

관측관측된 확률적합치잔차표준화 잔차
501.0000.0622.3572.40R
681.0000.0912.1892.28R
R  큰 잔차