계수에 대한 최대우도 추정치의 수렴을 차단하는 두 개의 조건인 완전 분리와 의사 완전 분리가 있습니다.
완전 분리는 예측 변수의 선형 조합이 반응 변수를 완벽하게 예측하는 경우 발생합니다. 예를 들어, 다음 데이터 집합에서 X ≤ 4이면 Y = 0입니다. X > 4이면 Y = 1입니다.
Y | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 |
X | 1 | 2 | 3 | 4 | 4 | 4 | 5 | 6 | 7 | 8 |
의사 완전 분리는 완전 분리와 유사합니다. 예측 변수가 전체가 아니라 대부분의 예측 변수 값에 대한 반응 변수를 완벽하게 예측합니다. 예를 들어, 이전 데이터 집합에서 X = 4인 값 중 하나에 대해 0 대신 Y = 1로 설정합니다. 이제 X < 4이면 Y = 0이고 X > 4이면 Y = 1이지만 X = 4이면 Y가 0 또는 1입니다. 데이터가 중간 범위에서 겹침에 따라 의사 완전 분리가 발생합니다.
Y | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 |
X | 1 | 2 | 3 | 4 | 4 | 4 | 5 | 6 | 7 | 8 |
데이터 집합이 너무 작아서 사건들이 너무 낮은 확률로 관측될 때 분리가 종종 발생합니다. 모형에 예측 변수가 더 많을수록, 데이터 내의 개별 그룹들은 더 작은 표본 크기를 가지게 되므로 분리가 발생하기 더 쉽습니다.
Minitab에서는 분리가 탐지될 때 경고를 표시하지만 모형에 예측 변수가 많을수록 분리의 원인을 식별하기가 더 어렵습니다. 모형에 교호작용 항이 포함되면 훨씬 더 어렵습니다.
과일 | 사건 | 시행 |
---|---|---|
자몽 | 0 | 10 |
오렌지 | 5 | 100 |
사과 | 25 | 100 |
바나나 | 40 | 100 |
과일 | 사건 | 시행 |
---|---|---|
감귤류 | 5 | 110 |
사과 | 25 | 100 |
바나나 | 40 | 100 |
기간의 범주 | 사건 | 시행 |
---|---|---|
1–90 | 2 | 2 |
91–180 | 1 | 2 |
181–270 | 1 | 2 |
271–360 | 0 | 2 |
정확한 기간 | 사건 | 시행 |
---|---|---|
45 | 1 | 1 |
60 | 1 | 1 |
95 | 1 | 1 |
176 | 0 | 1 |
185 | 0 | 1 |
241 | 1 | 1 |
280 | 0 | 1 |
299 | 0 | 1 |
분리에 대한 자세한 내용은 Albert and J. A. Anderson (1984) "On the existence of maximum likelihood estimates in logistic regression models" Biometrika 71, 1, 1–10을 참조하십시오.