이항 로지스틱 모형 적합에 대한 옵션 선택

통계분석 > 회귀 분석 > 이항 로지스틱 회귀 분석 > 이항 로지스틱 모형 적합 > 옵션

가중치

가중치에 가중치의 숫자 열을 입력하여 가중 회귀 분석을 수행합니다. 가중치는 0 이상이어야 합니다. 가중치 열의 행 수는 반응 열의 행 수와 같아야 합니다. 적절한 가중치를 결정하는 방법에 대한 자세한 내용은 가중 회귀 분석에서 확인하십시오.

모든 구간에 대한 신뢰 수준

계수와 적합치의 신뢰 구간에 대한 신뢰 수준을 입력합니다. 로짓 연결 함수를 사용하는 경우에는 이 신뢰 수준이 승산비의 신뢰 구간에 대한 신뢰 수준이기도 합니다.

일반적으로 95%의 신뢰 수준이 잘 작동합니다. 95% 신뢰 수준은 모집단에서 100개의 랜덤 표본을 추출할 경우 약 95개의 표본에 대한 신뢰 구간에 구간이 추정하는 모수가 포함된다는 것을 나타냅니다. 지정된 데이터 집합에 대해 신뢰 수준이 낮을수록 신뢰 구간이 좁아지고 신뢰 수준이 높을수록 구간이 넓어집니다.

참고

계수와 적합치에 대한 신뢰 구간을 표시하려면 결과 하위 대화 상자로 이동한 후 결과 표시에서 확장된 표을 선택해야 합니다.

신뢰 구간의 유형

양측 구간 또는 단측 구간을 선택할 수 있습니다. 동일한 신뢰 수준의 경우 한계가 구간보다 점 추정치에 더 가깝습니다. 상한은 하한이 될 수 있는 값을 제공하지 않습니다. 하한은 상한이 될 수 있는 값을 제공하지 않습니다.
양측
사건의 확률에 대한 하한 및 상한이 될 수 있는 값을 모두 추정하려면 양측 신뢰 구간을 사용합니다.
하한
사건의 확률에 대한 하한이 될 수 있는 값을 추정하려면 신뢰 하한을 사용합니다.
상한
사건의 확률에 대한 상한이 될 수 있는 값을 추정하려면 신뢰 상한을 사용합니다.

진단에 사용할 잔차

이탈도와 Pearson 잔차는 잔차 그림의 패턴과 특이치를 식별하는 데 도움이 됩니다. 모형에 의한 적합치가 낮은 관측치는 이탈도와 Pearson 잔차가 높습니다. Minitab은 각 구별 요인/공변량 패턴에 대한 잔차 값을 계산합니다.
  • 이탈도: 이탈도 잔차는 모형이 관측치를 얼마나 잘 예측하는지 측정합니다. 잔차의 분포는 최소 제곱 모형의 잔차 분포와 더 유사하므로, 로짓 연결 함수를 사용하는 로지스틱 회귀 분석에서는 이탈도 잔차가 자주 선호됩니다. 로짓 연결 함수는 가장 일반적인 연결 함수입니다.
  • Pearson: Pearson 잔차도 모형이 관측치를 얼마나 잘 예측하는지 측정합니다. 특이치는 흔히 워크시트의 관측치 순서에 따라 Pearson 잔차를 차트에 표시하는 방법으로 식별합니다.

분산 분석표에 대한 검정

분산 분석 표에 대한 검정을 선택합니다.
  • Wald 검정: 대부분의 경우 기본 Wald 검정이 효과적입니다.
  • 우도 비 검정: 우도 비 검정을 선호하는 경우 이 옵션을 선택합니다.
이탈도 유형
카이-제곱 값과 p-값의 계산에 사용할 이탈도를 선택합니다. 수정 이탈도가 가장 많이 사용됩니다. 항이 모형에 들어오는 순서를 기준으로 항의 유의도를 확인하려면 순차 이탈도를 사용하십시오.
  • 수정 제곱합(제3종): 각 항에 대해 나머지 항을 모두 포함하는 모형에 대한 상대적인 이탈도 감소를 측정합니다.
  • 순차 제곱합(제1종): 항을 해당 항의 이전 항만 포함하는 모형에 추가하는 경우 감소하는 이탈도를 측정합니다.

Hosmer-Lemeshow 검정을 위한 그룹 수

Hosmer-Lemeshow 검정을 위한 그룹 수를 입력합니다. 이 필드를 비워두면 Minitab에서 같은 크기의 그룹 10개를 만듭니다. 대부분의 데이터 집합인 경우 그룹이 10개면 적절합니다.

Hosmer-Lemeshow 검정은 관측 빈도와 기대 빈도를 비교하여 모형 적합치를 평가하는 적합도 검정입니다. 이 검정에서는 추정 확률이 작은 값에서부터 큰 값 순으로 데이터를 그룹으로 나눈 다음 카이-제곱 검정을 수행하여 관측 빈도와 기대 빈도가 유의하게 다른지 확인합니다. 고유한 요인/공변량 패턴의 수가 작거나 큰 경우에는 그룹의 수를 변경할 수도 있습니다. 예를 들어, 그룹의 수를 줄여 그룹 내 기대값을 증가시킬 수 있습니다. 또는 그룹의 수를 늘려 관측값과 기대값의 비교 결과를 더 자세하게 확인할 수 있습니다. Hosmer와 Lemeshow는 최소 6개의 그룹을 사용할 것을 권장합니다1.

1 D.W. Hosmer and S. Lemeshow (2000). Applied Logistic Regression. 2nd ed. John Wiley & Sons, Inc.