중위수는 데이터 집합의 중간점입니다. 중간점 값은 관측치의 반이 이 값보다 크고 관측치의 반이 이 값보다 작은 점입니다. 중위수는 관측치에 순위를 매기고 순위가 [N + 1] / 2인 관측치를 찾는 방법으로 결정됩니다. 데이터에 짝수 개의 관측치가 포함되어 있는 경우에는 순위가 N / 2인 관측치와 순위가 [N / 2] + 1인 관측치의 평균 값이 중위수입니다.
표본 중위수는 각 그룹의 모집단 중위수에 대한 추정치입니다. 전체 중위수는 모든 관측치의 중위수입니다.
N>(전체 중위수보다 큰 관측치 수). 이 값은 요인의 각 그룹에서 전체 중위수보다 큰 관측치의 수를 나타냅니다. Minitab에서는 N보다 작거나 같은 값(N≤)과 N보다 큰 값(N>)을 사용하여 표를 만듭니다. Minitab에서는 근사의 카이-제곱 검정을 수행하고 검정에 대한 p-값을 계산하기 위해 이 값들을 사용합니다.
많은 수의 관측치가 이 범주에 있는 그룹의 경우, 그룹의 중위수가 전체 중위수보다 클 가능성이 높습니다.
N≤(전체 중위수보다 작거나 같은 관측치 수)는 각 그룹에서 전체 중위수보다 작거나 같은 관측치의 수입니다. Minitab에서는 N보다 작거나 같은 값(N≤)과 N보다 큰 값(N>)을 사용하여 표를 만듭니다. Minitab에서는 근사의 카이-제곱 검정을 수행하고 검정에 대한 p-값을 계산하기 위해 이 값들을 사용합니다.
많은 수의 관측치가 이 범주에 있는 그룹의 경우, 그룹의 중위수가 전체 중위수보다 작을 가능성이 높습니다.
사분위간 범위(Q3 – Q1)는 각 그룹 내 데이터의 산포도를 측정합니다. 범위는 75번째 백분위수(Q3)와 25번째 백분위수(Q1) 간의 거리입니다.
사분위간 범위가 크게 다르면 그룹의 산포가 같지 않다는 것을 나타냅니다. 이는 데이터가 그룹의 모양과 산포가 같다는 Mood의 중위수 검정 가정을 충족하지 않을 수도 있음을 의미합니다.
신뢰 구간은 각 모집단의 실제 중위수가 포함될 가능성이 높은 값의 범위입니다.
표본이 랜덤이기 때문에 모집단의 두 표본에서 동일한 신뢰 구간이 생성될 가능성은 없습니다. 그러나 표본 추출을 여러 번 반복하면 일정한 백분율의 신뢰 구간에는 알 수 없는 모집단 모수가 포함됩니다. 모수를 포함하는 이러한 신뢰 구간의 백분율이 해당 구간의 신뢰 수준입니다.
각 그룹에 대한 모집단 중위수의 추정치를 평가하려면 신뢰 구간을 사용합니다.
예를 들어, 95% 신뢰 수준에서 신뢰 구간에 그룹 중위수가 포함된다고 95% 확신할 수 있습니다. 신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오.
온도 | 중위수 | N <= 전체 중위수 | N > 전체 중위수 | Q3 – Q1 | 95% 중위수 CI |
---|---|---|---|---|---|
38 | 19 | 4 | 3 | 4.00 | (17.4667, 22.5333) |
42 | 19 | 3 | 3 | 9.50 | (15.3571, 25.6429) |
46 | 22 | 2 | 4 | 7.25 | (15.7857, 26.5714) |
50 | 18 | 4 | 2 | 4.25 | (14.4286, 20.6429) |
전체 | 19 |
구간은 온도 38도의 중위수가 19.0이고 신뢰 구간이 대략 17.5에서 22.5까지라는 것을 보여줍니다.
자유도(DF)는 데이터 내 그룹의 수에서 1을 뺀 값입니다. 귀무 가설 하에서는 카이-제곱 분포가 지정된 자유도의 검정 통계량 분포와 근사합니다. Minitab에서는 카이-제곱 분포를 사용하여 이 검정의 p-값을 추정합니다.
카이-제곱 통계량은 데이터 내 그룹 및 그룹에 해당하는 N≤ 값과 N> 값을 바탕으로 하는 셀로 구성된 표에서 계산됩니다. Minitab에서는 해당 셀의 관측값과 기대값의 차이 제곱을 해당 셀의 기대값으로 나누어서 각 셀의 값을 계산합니다. 카이-제곱 통계량은 이 값들의 합입니다.
카이-제곱 값이 크면 관측값과 기대값의 차이가 크다는 것을 나타냅니다. 카이-제곱 값이 충분히 크면 중위수의 차이 중 하나 이상이 통계적으로 유의하다는 것을 나타냅니다. Minitab에서는 카이-제곱 통계량을 카이-제곱 분포와 함께 사용하여 p-값을 계산합니다.
카이-제곱 통계량을 사용하여 귀무 가설의 기각 여부를 확인할 수 있습니다. 그러나 일반적으로 검정의 p-값을 사용하여 결정을 내리는 것이 더 실제적이고 편리합니다.
p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.
중위수 간의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 사용합니다.