교차표 및 카이-제곱 검정에 대한 데이터 고려 사항

유효한 결과를 얻으려면 데이터를 수집하고 분석을 수행하거나 결과를 해석할 때 다음 지침을 따르십시오.

표본은 랜덤하게 선택해야 합니다.

랜덤 표본은 모집단에 대한 일반화 또는 추론을 작성하기 위해 사용됩니다. 데이터가 랜덤하게 수집되지 않은 경우에는 결과가 유효하지 않을 수도 있습니다.

각 관측치는 다른 모든 관측치로부터 독립적이어야 합니다.

관측치의 독립성은 연관성의 카이-제곱 검정에 대한 중요한 가정입니다.

모든 데이터를 서로 배타적인 행과 열 범주로 분류해야 합니다.

변수 범주가 겹치는 경우 카이-제곱 연관성 검정을 수행할 수 없습니다. 그러므로, 각 관측치를 하나의 범주로만 분류해야 합니다.

기대 카운트가 너무 작지 않아야 합니다.
각 표본은 모든 범주의 결과를 합리적으로 관측할 수 있을 만큼 충분히 커야 합니다. 기대 카운트가 너무 낮으면 검정의 p-값이 정확하지 않을 수 있습니다. Minitab은 결과에서 기대 카운트가 너무 낮은지 여부를 나타냅니다.
한 범주에 대한 기대 카운트가 너무 작으면 해당 범주를 인접 범주와 결합하여 최소 기대 카운트를 얻지 못할 수도 있습니다. 범주를 결합하면 정보가 손실되므로 필요한 경우에만 범주를 결합해야 합니다. 또는 표본 크기에 상관없이 Fisher의 정확 검정을 사용할 수 있습니다. 자세한 내용은 Fisher의 정확 검정 정의에서 확인하십시오.