Mann-Whitney 검정의 ETA1 - ETA2, W 및 p-값에 대한 점 추정치 계산

첫 번째 표본(Samp1)에 대한 데이터가 22, 24, 25, 29, 30이고 두 번째 표본(Samp2)에 대한 데이터가 16, 21, 22, 23이라고 가정합니다. Mann-Whitney 검정 결과는 다음과 같습니다.

Mann-Whitney: C1, C2

방법 η₁: C1에 대한 중위수 η₂: C2에 대한 중위수 차이: η₁ - η₂
기술 통계량 표본 N 중위수 C1 5 25.0 C2 4 21.5
차이 추정치 달성된 차이 차이에 대한 CI 신뢰 수준 6 (-0.0000000, 13) 96.27%
검정 귀무 가설 H₀: η₁ - η₂ = 0 대립 가설 H₁: η₁ - η₂ ≠ 0
방법 W-값 P-값 같은 값에 대해 수정되지 않음 33.50 0.050 같은 값에 대해 수정됨 33.50 0.049

점 추정치 계산

η1 – η2에 대한 점 추정치는 두 표본 사이의 가능한 모든 데이터 쌍 차이의 중위수입니다.

이 예의 경우, 5*4 = 20개의 데이터 쌍들의 차이가 있습니다. 이 예에서 가능한 데이터 쌍들의 차이는 다음과 같습니다. 22-16 = 6, 22-21 = 1, 22-22= 0, 22-23= −1, 8, 3, 2, 1, 9, 4, 3, 2, 13, 8, 7, 6, 14, 9, 8, 7.

Note

Minitab에서 통계분석 > 비모수 통계 > 데이터 쌍들의 차이를 선택하여 2개 열 간의 모든 데이터 쌍들의 차이를 구할 수 있습니다.

이러한 데이터 쌍들 차이의 중위수는 6입니다.

W 계산

W = (양의 차이의 수) + 0.5(0과 같은 차이의 수) + 0.5(n1(n1+1)), 여기서 n1은 첫 번째 표본의 관측치 개수입니다.

이 예의 경우 W = 18 + 0.5(1) + 0.5*5*6 = 18 + 0.5 + 15 = 33.5입니다.

p-값 계산

p-값은 W에 대한 검정 통계량을 기반으로 합니다. 검정 통계량 Z(결과의 일부가 아님)는 W의 평균 및 분산을 사용한 정규 근사치입니다.

W의 평균= 0.5(n1 (n1 + n2 + 1)) W 분산 = n1*n2(n1+n2+1)/12, 여기서 n1 및 n2은 각각 첫 번째와 두 번째 표본의 관측치 수입니다.

Z = (|W - W의 평균| - .5)/W 분산의 제곱근.

Note

분모에서 0.5를 빼면 연속성 수정 요인입니다.

Ha: η1 < η2에 대한 p-값은 CDF(Z)입니다. Ha: η1 > η2에 대한 p-값은 (1 - CDF(Z))입니다. Ha: η1 ≠ η2에 대한 p-값은 2*(1 - CDF(Z))입니다. CDF는 표준 정규 분포의 누적 확률입니다.

이 예의 경우:
  • W의 평균 = 0.5*5(5+4+1) = 2.5*10 = 25
  • W의 분산 = 5*4(5+4+1)/12 = 20*10/12 = 200/12 = 16.6667

Z = (|33.5 - 25| - .5)/sqrt(16.6667) = 1.9596

Ha: η1 ≠ η2에 대한 p-값은 2*(1 - 0.974979.) = 0.05입니다.

Note

Minitab에서 계산 > 확률 분포 > 정규 분포를 선택하여 누적 확률을 얻을 수 있습니다.