이항 로지스틱 모형 적합에 대한 코드화 방법 지정

통계분석 > 회귀 분석 > 이항 로지스틱 회귀 분석 > 적합 이항 로지스틱 모형 > 코드화

승산비 증분

로짓 연결 함수를 사용하는 모형의 경우 Minitab에서는 승산비를 계산합니다. 일부 예측 변수의 경우 예측 변수의 1단위 변화에 대한 기본 승산비는 유용하지 않습니다. 예를 들어, 1그램 변화에 대한 승산비가 너무 작은 경우 1킬로그램의 변화에 대한 승산비를 보려면 1,000을 입력하십시오.
계량형 예측 변수
모형 내 모든 계량형 예측 변수의 이름이 표시됩니다. 이 열에는 값을 입력할 수 없습니다.
증분
Minitab에서 승산비를 계산하기 위해 사용하는 계량형 예측 변수의 변화량을 입력합니다.

범주형 변수 코드화

범주형 예측 변수 코드화
Minitab에서는 분석을 수행하기 위해 두 가지 방법 중 하나를 사용하여 범주형 데이터를 다시 코드화해야 합니다. 예측 변수의 수준을 기준선 또는 기준 수준과 비교할 것인지 여부를 기준으로 방법을 변경하는 것을 고려해 보십시오. 코드화 방법에 따라 예측 변수의 전체 효과 검정이 달라지지 않습니다. 자세한 내용은 Coding schemes for categorical predictors에서 확인하십시오.
  • (-1, 0, +1): 각 수준과 기준선 간의 차이를 추정하려면 이 옵션을 선택합니다.
  • (1, 0): 각 수준과 기준 수준 간의 차이를 추정하려면 이 옵션을 선택합니다. (1, 0) 코드화 방법을 선택하는 경우 대화 상자에서 기준 수준 표가 활성화됩니다.
기준 수준 표
범주형 예측 변수
표의 이 열에는 모형 내 모든 범주형 변수의 이름이 표시됩니다. 이 열에는 값을 입력할 수 없습니다.
기준 수준

Minitab에서는 기준이 아닌 수준을 기준 수준과 비교합니다. 기준 수준을 변경해도 전체 유의성에는 영향을 미치지 않지만 해석할 계수와 승산비를 더욱 의미있게 만들 수 있습니다.

예를 들어, 고객에게 자녀가 있는지 여부에 대한 범주형 예측 변수의 수준은 "예" 및 "아니요"입니다. 반응 사건은 고객이 쇼핑할 때 시리얼을 구입하는 것입니다.

기준 사건은 승산비의 분모에 있습니다. 기준 수준을 변경하면 승산비가 역으로 바뀝니다. 기준 수준이 "아니요"인 경우 승산비는 다음과 같습니다.
승산비 5는 요인이 "예"일 때 고객이 시리얼을 구입할 확률이 요인이 "아니요"일 때의 5배라는 것을 나타냅니다.
기준 수준이 "예"인 경우 승산비는 다음과 같습니다.
승산비 0.2는 요인이 "아니요"일 때 고객이 시리얼을 구입할 확률이 요인이 "예"일 때의 0.2배라는 것을 나타냅니다.

기준 수준을 변경하면 계수의 부호가 변경됩니다. 기준 수준이 "예"이면 계수가 -1.6입니다. 계수가 음이면 요인의 기준 수준에서 고객이 시리얼을 구입할 확률이 증가한다는 것을 나타냅니다. 기준 수준이 "아니요"이면 계수의 부호가 변경되어 1.6이 됩니다. 계수가 양이면 요인의 기준 수준에서 고객이 시리얼을 구입할 확률이 감소한다는 것을 나타냅니다.

계량형 예측 변수 표준화

모형의 계량형 예측 변수를 표준화할 수 있습니다. 표준화된 예측 변수는 모형을 적합화하는 데만 사용되고 워크시트에는 저장되지 않습니다.

계량형 예측 변수를 표준화하면 특정 조건에서 모형 해석이 개선될 수 있습니다.
  1. 평균을 빼서 계량형 예측 변수를 중앙에 표시: 이 방법은 다중 공선성을 줄이므로 계수 추정 정밀도를 개선하는 데 도움이 됩니다. 모형에 상관 관계가 높은 예측 변수, 고차항, 교호작용 항이 포함되어 있는 경우 유용한 방법입니다. 각 계수는 원래 측정 척도를 사용한 예측 변수의 1단위 변동에 대한 반응의 예상 변동을 나타냅니다.
  2. 표준 편차로 나눠서 계량형 예측 변수의 척도 표준화: 이 방법을 사용하면 계수 크기를 비교할 수 있도록 예측 변수 범위의 동질성이 높아집니다. 척도의 차이를 관리하면서 어느 예측 변수의 효과가 더 큰지 알려는 경우 유용한 방법입니다. 그러나 각 계수는 예측 변수의 단일 표준 편차 변동을 감안한 반응의 예상 변동을 나타냅니다.
계량형 예측 변수를 표준화하려면 다음 방법 중 하나를 사용하십시오.
  • 표준화 안 함: 원래 데이터를 계량형 예측 변수로 사용합니다.
  • 코드화할 낮은 수준과 높은 수준을 -1과 +1로 지정: 예측 변수를 중앙에 표시하고 비교 가능한 척도에 배치하는 데 모두 사용합니다. Minitab은 이 방법을 실험 계획(DOE)에 사용합니다. 지정한 하한 값과 상한 값 사이에 있는 모든 데이터 값은 -1과 +1 사이에 있도록 변환됩니다. 표에 하한 값과 상한 값을 입력하거나 표준의 기본 최소값과 최대값을 사용하십시오.
    계량형 예측 변수
    모형에 있는 모든 범주형 예측 변수의 이름을 표시합니다. 이 열에는 값을 입력할 수 없습니다.
    낮음
    코드에 값을 -1로 입력합니다. 기본값은 표본의 최소값입니다.
    높음
    코드화할 값을 +1로 입력합니다. 기본값은 표본의 최대값입니다.
  • 평균값을 뺀 후 표준 편차로 나누기: 예측 변수를 중앙에 표시하고 비교 가능한 척도에 배치하는 데 모두 사용합니다.
  • 평균값 빼기: 예측 변수를 중앙으로 보내는 데 사용합니다.
  • 표준 편차로 나누기: 모든 예측 변수에 비교 가능한 척도를 사용합니다.
  • 지정된 값을 뺀 후 다른 값으로 나누기: 표본의 추정 평균과 표준 편차를 사용하지 않고 다른 값을 지정합니다.
    계량형 예측 변수
    모형에 있는 모든 범주형 예측 변수의 이름을 표시합니다. 이 열에는 값을 입력할 수 없습니다.
    빼기
    각 계량형 예측 변수에서 뺄 값을 입력합니다.
    나누기
    Minitab이 뺀 결과를 나누는 데 사용하는 값을 입력합니다.
이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오