비정규 데이터를 사용하여 가설 검정을 수행하는 데는 여러 가지 방법이 있습니다.
많은 가설 검정이 공식적으로는 정규성 가정을 기반으로 하지만, 표본이 충분히 큰 경우 비정규 데이터로도 좋은 결과를 얻을 수 있습니다. 필요한 데이터의 양은 데이터가 얼마나 비정규적인 지에 따라 다르지만, 20의 표본 크기가 보통 적절합니다. 정규성에 대한 로버스트성과 표본 크기 간의 관계는 중심 극한 정리를 기반으로 합니다. 이 정리에 따르면 모든 분포에서 추출한 데이터 평균의 분포도 표본 크기가 증가하면 정규 분포에 근사합니다. 따라서 모평균에 대한 추론에 관심이 있는 경우 표본이 충분히 크면 정규성 가정이 중요하지 않습니다.
비모수 검정에서는 모집단에 대해 특정 분포를 가정하지 않습니다. Minitab에서는 정규성을 가정하는 검정 대신 사용할 수 있는 여러 비모수 검정을 제공합니다. 이러한 검정은 표본 크기가 작고 치우쳐 있거나 표본에 특이치가 여러 개 포함되어 있는 경우 특히 유용합니다.
정규성을 가정하는 검정 | 동등한 비모수 검정 |
---|---|
1-표본 Z 검정, 1-표본 t 검정 | 1-표본 부호 검정, 1-표본 Wilcoxon 검정 |
2-표본 t 검정 | Mann-Whitney 검정 |
분산 분석 검정 | Kruskal-Wallis 검정, Mood의 중위수 검정, Friedman 검정 |
비모수 검정이 데이터에 대한 가정에서 완전히 자유로운 것은 아닙니다. 예를 들어 비모수 검정에서도 데이터는 독립적인 랜덤 표본이어야 합니다.
경우에 따라 데이터에 함수를 적용하여 데이터가 정규 분포를 따르도록 변환하고 분석을 완료할 수 있습니다.