카이-제곱 적합도 검정에 대한 데이터 고려 사항

유효한 결과를 얻으려면 데이터를 수집하고 분석을 수행하거나 결과를 해석할 때 다음 지침을 따르십시오.

표본은 랜덤하게 선택해야 합니다.: 랜덤 표본은 모집단에 대한 일반화 또는 추론을 작성하기 위해 사용됩니다. 데이터가 랜덤하게 수집되지 않은 경우에는 결과가 유효하지 않을 수도 있습니다.
변수가 범주형 변수여야 합니다.: 범주형 변수에는 유한하고 셀 수 있는 수의 범주 또는 고유 그룹이 포함됩니다. 범주형 데이터에는 논리적 순서가 없을 수도 있습니다. 예를 들어, 범주형 변수에는 성별, 재료 유형, 결제 방법이 포함됩니다.
각 범주에 대한 기대 카운트가 너무 작지 않아야 합니다.: 각 표본은 모든 범주의 결과를 합리적으로 관측할 수 있을 만큼 충분히 커야 합니다. 기대 카운트가 너무 낮으면 검정의 p-값이 정확하지 않을 수 있습니다. Minitab은 결과에서 기대 카운트가 너무 낮은지 여부를 나타냅니다.; 한 범주에 대한 기대 카운트가 너무 작으면 해당 범주를 인접 범주와 결합하여 최소 기대 카운트를 얻지 못할 수도 있습니다. 범주를 결합하면 정보가 손실되므로 필요한 경우에만 범주를 결합해야 합니다.