카이-제곱 통계량의 정의

카이-제곱 통계량은 데이터의 분포 및 사용자가 선택한 기대 또는 가정된 분포 사이의 차이를 나타내는 측정값입니다. 예는 다음과 같습니다.
  • 범주형 범수 간의 독립성을 검정하거나 연관성을 확인하는 데 사용합니다. 예를 들어, 유권자의 성별에 따라 구분된 선거 결과가 포함된 이원 표가 있는 경우, 카이-제곱 통계량을 사용하여 유권자의 성별이 투표와 상관 없는지 또는 투표와 성별 간에 어떤 연관성이 있는지 여부를 확인할 수 있습니다. 카이-제곱 통계량에 연관된 p-값이 선택한 α보다 작은 경우, 검정은 두 변수가 독립적이라는 귀무가설을 기각합니다.
  • 통계적 모형이 데이터에 적합한지 결정하는 데 사용합니다. 카이-제곱 통계량에 연관된 p-값이 선택한 α보다 작은 경우, 검정은 모형이 데이터에 적합하다는 귀무가설을 기각합니다.

범주형 데이터의 경우 Minitab에서는 각 범주의 카이-제곱 값에 대한 기여도를 파악함으로써, 전체 카이-제곱 값 중에서 각 범주의 차이로 인한 비율을 양적으로 나타낼 수 있습니다. 예를 들어, 적합도 검정에서 귀무 가설을 기각할 경우 이러한 결과는 모든 범주가 각 범주의 기대값과 조금씩 차이가 있기 때문인지 아니면 한 범주에서만 해당 범주의 기대값과 크게 차이가 있기 때문에 발생합니까? 예를 들어, 매우 넓은 주차장에서 표본으로 추출한 100대의 차량 중에 세단 50대, 트럭 27대, 밴 23대가 포함될 것으로 기대하지만 실제로는 세단 61대, 트럭 16대, 밴 23대가 포함된다고 가정합니다. "세단"과 "트럭" 범주는 기대값을 충족하지 못하지만 "밴"은 기대값을 충족합니다. 따라서 "밴"은 카이-제곱 값에 아무런 기여도 하지 않습니다. 데이터의 모든 차이는 "세단"과 "트럭" 범주에서 발생한 것입니다.

참고

Minitab에서는 카이-제곱 통계량을 계산할 때 Yates의 수정 요인을 사용하지 않습니다.