첫 번째 표본(Samp1)에 대한 데이터가 22, 24, 25, 29, 30이고 두 번째 표본(Samp2)에 대한 데이터가 16, 21, 22, 23이라고 가정합니다. Mann-Whitney 검정 결과는 다음과 같습니다.
η1 – η2에 대한 점 추정치는 두 표본 사이의 가능한 모든 데이터 쌍 차이의 중위수입니다.
이 예의 경우, 5*4 = 20개의 데이터 쌍들의 차이가 있습니다. 이 예에서 가능한 데이터 쌍들의 차이는 다음과 같습니다. 22-16 = 6, 22-21 = 1, 22-22= 0, 22-23= −1, 8, 3, 2, 1, 9, 4, 3, 2, 13, 8, 7, 6, 14, 9, 8, 7.
Minitab에서
를 선택하여 2개 열 간의 모든 데이터 쌍들의 차이를 구할 수 있습니다.이러한 데이터 쌍들 차이의 중위수는 6입니다.
W = (양의 차이의 수) + 0.5(0과 같은 차이의 수) + 0.5(n1(n1+1)), 여기서 n1은 첫 번째 표본의 관측치 개수입니다.
이 예의 경우 W = 18 + 0.5(1) + 0.5*5*6 = 18 + 0.5 + 15 = 33.5입니다.
p-값은 W에 대한 검정 통계량을 기반으로 합니다. 검정 통계량 Z(결과의 일부가 아님)는 W의 평균 및 분산을 사용한 정규 근사치입니다.
W의 평균= 0.5(n1 (n1 + n2 + 1)) W 분산 = n1*n2(n1+n2+1)/12, 여기서 n1 및 n2은 각각 첫 번째와 두 번째 표본의 관측치 수입니다.
Z = (|W - W의 평균| - .5)/W 분산의 제곱근.
분모에서 0.5를 빼면 연속성 수정 요인입니다.
Ha: η1 < η2에 대한 p-값은 CDF(Z)입니다. Ha: η1 > η2에 대한 p-값은 (1 - CDF(Z))입니다. Ha: η1 ≠ η2에 대한 p-값은 2*(1 - CDF(Z))입니다. CDF는 표준 정규 분포의 누적 확률입니다.
Z = (|33.5 - 25| - .5)/sqrt(16.6667) = 1.9596
Ha: η1 ≠ η2에 대한 p-값은 2*(1 - 0.974979.) = 0.05입니다.
Minitab에서
를 선택하여 누적 확률을 얻을 수 있습니다.