이항 로지스틱 모형 적합에 대한 데이터 고려 사항

이항 로지스틱 모형 적합 을 클릭하고 이항 로지스틱 회귀 분석 다른 메뉴에서 동일한 분석을 수행합니다. 결과가 유효한지 확인하려면 데이터를 수집하고 분석을 수행하며 결과를 해석할 때 다음 지침을 고려하십시오.

예측 변수는 계량형 또는 범주형일 수 있습니다

계량형 변수는 측정 및 정렬할 수 있으며 두 값 사이에 무한한 수의 값이 있습니다. 예를 들어 타이어 표본의 직경은 계량형 변수입니다.

범주형 변수에는 셀 수 있는 유한의 범주 수 또는 고유 그룹이 포함됩니다. 범주형 데이터에는 논리적 순서가 없을 수도 있습니다. 예를 들어, 범주형 예측 변수에는 성별, 재료 유형, 결제 방법이 포함됩니다.

이산형 변수가 있는 경우 이 변수를 계량형 예측 변수로 간주할 것인지, 범주형 예측 변수로 간주할 것인지 결정할 수 있습니다. 이산형 변수는 측정 및 정렬이 가능하지만 셀 수 있는 수의 값을 가질 수 있습니다. 예를 들어, 한 가구에 거주하는 사람의 수는 이산형 변수입니다. 이산형 변수를 계량형으로 간주할 것인지, 범주형으로 간주할 것인 지는 수준 개수 및 분석 목적에 따라 결정됩니다. 자세한 내용은 범주형, 이산형 및 계량형 변수의 정의(으)로 이동하십시오.

내포되거나 변량인 범주형 예측 변수가 있으면 모두 고정 요인인 경우 일반 선형 모형 적합, 변량 요인이 있는 경우 혼합 효과 모형 적합을 사용하십시오. 일반 선형 모형 적합의 경우 반응 변수는 계량형입니다.

반응 변수가 이항이어야 함
이항 반응에는 통과 또는 실패와 같은 두 가지 결과가 있습니다.
  • 반응 변수에 자연스러운 순서를 갖는 세 개 이상의 범주가 있으면(예: 적극 반대, 반대, 중립, 찬성, 적극 찬성) 순서형 로지스틱 회귀 분석을 사용하십시오.
  • 반응 변수에 자연스러운 순서를 갖지 않는 세 개 이상의 범주가 있으면(예: 긁힘, 패임, 찢어짐) 명목형 로지스틱 회귀 분석을 사용하십시오.
  • 반응 변수가 발생 횟수를 카운트하면(예: 결점 수) 포아송 모형 적합을 사용하십시오.
모형 검증 기술 사용 고려
Minitab에서는 검정 데이터 세트 또는 교차 검증을 사용하여 모형의 성능을 검증할 수 있습니다. 모형 적합 프로세스의 데이터에 대한 이탈도 R2와 같은 모형 요약 통계는 낙관적인 경향이 있습니다. 검정 데이터 세트 또는 교차 검증을 사용하면 새 데이터에 대해 모형이 수행하는 방식을 보다 정확하게 표현할 수 있습니다.
최적의 경험을 사용한 데이터 수집
유효한 결과를 얻으려면 다음 지침을 따르십시오.
  • 데이터가 관심 있는 모집단을 나타내는지 확인합니다.
  • 필요한 정밀도를 제공하기에 충분한 데이터를 수집합니다.
  • 최대한 정확하게 변수를 측정합니다.
  • 데이터를 수집된 순서대로 기록합니다.
예측 변수 간의 상관(다중 공선성이라고도 함)이 심각하지 않아야 합니다.

다중 공선성이 심각하면 모형에 포함할 예측 변수를 결정하지 못할 수도 있습니다. 다중 공선성의 심각성을 확인하려면 결과의 계수 표에 있는 분산 팽창 인수(VIF)를 사용하십시오.

모형이 데이터를 잘 적합해야 함

모형이 데이터를 적합시키지 않으면 잘못된 결과를 얻을 수 있습니다. 결과에서 잔차 그림, 비정상적인 관측치에 대한 진단 통계량 및 모형 요약 통계량을 사용하여 모형이 데이터를 얼마나 잘 적합시키는지 확인하십시오.