카이-제곱 적합도 검정에 대한 데이터 고려 사항

유효한 결과를 얻으려면 데이터를 수집하고 분석을 수행하거나 결과를 해석할 때 다음 지침을 따르십시오.

표본은 랜덤하게 선택해야 합니다.

랜덤 표본은 모집단에 대한 일반화 또는 추론을 작성하기 위해 사용됩니다. 데이터가 랜덤하게 수집되지 않은 경우에는 결과가 유효하지 않을 수도 있습니다.

변수가 범주형 변수여야 합니다.
범주형 변수에는 유한하고 셀 수 있는 수의 범주 또는 고유 그룹이 포함됩니다. 범주형 데이터에는 논리적 순서가 없을 수도 있습니다. 예를 들어, 범주형 변수에는 성별, 재료 유형, 결제 방법이 포함됩니다.
각 범주에 대한 기대 카운트가 너무 작지 않아야 합니다.
각 표본은 모든 범주의 결과를 합리적으로 관측할 수 있을 만큼 충분히 커야 합니다. 기대 카운트가 너무 낮으면 검정의 p-값이 정확하지 않을 수 있습니다. Minitab은 결과에서 기대 카운트가 너무 낮은지 여부를 나타냅니다.
한 범주에 대한 기대 카운트가 너무 작으면 해당 범주를 인접 범주와 결합하여 최소 기대 카운트를 얻지 못할 수도 있습니다. 범주를 결합하면 정보가 손실되므로 필요한 경우에만 범주를 결합해야 합니다.