교차표 및 카이-제곱에 대한 연관성 측도

연관성 측도와 함께 제공되는 모든 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

Fisher의 정확 검정, p-값

Fisher의 정확 검정은 독립성 검정입니다. Fisher의 정확 검정은 기대 셀 카운트가 낮고 카이-제곱 근사가 매우 좋지 않을 때 유용합니다.

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

변수가 독립적이라는 귀무 가설을 기각할 수 있는지, 기각할 수 없는지 확인하려면 p-값을 사용합니다.

해석

변수가 서로 독립적인지 여부를 확인하려면 p-값을 유의 수준과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 변수 간에 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 변수 간에 통계적으로 유의한 연관성이 있습니다(H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각하고 변수 간에 통계적으로 유의한 연관성이 있다는 결론을 내립니다.
p-값 > α: 변수가 서로 연관되어 있다는 결론을 내릴 수 없습니다(H0 기각 실패)
p-값이 유의 수준보다 크면 변수가 서로 연관되어 있다는 결론을 내릴 수 있는 충분한 증거가 없기 때문에 귀무 가설을 기각할 수 없습니다.

자세한 내용은 Fisher의 정확 검정 정의에서 확인하십시오.

McNemar의 검정

쌍체 비율이 서로 다른지 여부를 확인하려면 McNemar의 검정을 사용합니다.

해석

추정된 차이
Minitab에서는 주변 비율 간의 차이를 계산합니다.
95% CI
Minitab에서는 주변 확률 간의 차이에 대한 95% 신뢰 구간을 계산합니다.
95% 신뢰 구간(95% CI)은 주변 확률 간 차이의 실제 값을 포함할 가능성이 있는 값의 범위입니다.
P
Minitab에서는 귀무 가설을 검정하기 위해 p-값을 계산합니다.
주변 확률이 유의하게 다른지 여부를 확인하려면 p-값을 유의 수준(α 또는 알파로 표시함)과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 주변 확률이 같다는 것입니다. 일반적으로 0.05의 유의 수준이 좋습니다. 0.05의 유의 수준은 차이가 존재하지 않는데 차이가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 주변 확률이 통계적으로 서로 다름
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각하고 주변 확률이 유의하게 서로 다르다는 결론을 내립니다. 예를 들어, 사전 확률은 사후 확률과 다릅니다.
p-값 > α: 주변 확률이 유의하게 서로 다르지 않음
p-값이 유의 수준보다 크거나 같으면 주변 확률이 서로 다르다는 결론을 내릴 수 있는 충분한 증거가 없기 때문에 귀무 가설을 기각할 수 없습니다. 예를 들어, 사전 확률과 사후 확률이 서로 다르다는 결론을 내릴 수 없습니다.

자세한 내용은 McNemar의 검정을 사용해야 하는 이유에서 확인하십시오.

Cochran-Mantel-Haenszel의 검정

세 번째 범주형 변수가 존재하는 경우 두 이항 변수의 조건부 연관성을 검정하려면 CMH 검정을 사용합니다.

Minitab에서는 여러 표에서 공통 승산비와 p-값을 계산하여 유의성을 평가합니다.

해석

공통 승산비
Minitab에서는 연관성의 강도를 나타내는 공통 승산비를 계산합니다.
CMH 통계량
CMH 통계량은 연관성이 통계적으로 유의한지 여부를 나타내기 위해 사용됩니다.
DF
CMH 통계량은 자유도가 1인 카이-제곱 백분위수와 비교됩니다.
p-값
Minitab에서는 귀무 가설을 검정하기 위해 p-값을 계산합니다.
두 이항 변수가 세 번째 변수에 대해 조건부로 서로 독립적이라는 귀무 가설을 기각할 수 있는지, 기각할 수 없는지 확인하려면 p-값을 사용합니다.

자세한 내용은 Cochran-Mantel-Haenszel 검정의 정의에서 확인하십시오.

Cramer의 V-제곱

Cramer의 V2은 두 변수(행 변수와 열 변수) 간의 연관성을 측정합니다. Cramer의 V2 값의 범위는 0에서 1 사이입니다. Cramer의 V2 값이 클수록 변수 간의 관계가 더 강하고, V2 값이 작을수록 변수 간의 관계가 약하다는 것을 나타냅니다. 0 값은 연관성이 없음을 나타냅니다. 1 값은 변수 간에 매우 강한 연관성이 있음을 나타냅니다.

카파

카파는 여러 평가자가 동일한 표본을 평가할 때 명목형 또는 순서형 평가의 합치도를 측정합니다. 1-5의 척도를 사용하여 결점의 심각한 정도를 표시할 때처럼 순서형 평가를 하는 경우에는 일반적으로 카파보다는 순서형 범주에 대한 부합성 측도가 연관성을 평가하는 데 더 적절한 통계량입니다.

해석

카파 값의 범위는 -1에서 +1 사이입니다. 카파 값이 클수록 합치도가 강합니다.

카파 값에 따라 다음과 같이 결론을 내릴 수 있습니다.
  • 카파 = 1이면 완전하게 합치하는 것입니다.
  • 카파 = 0이면 합치가 우연히 발생하기를 기대하는 것과 같습니다.
  • 카파 < 0이면 합치가 우연히 발생하기를 기대하는 것보다 약합니다. 이러한 경우는 거의 발생하지 않습니다.

Goodman-Kruskal 람다 및 타우

Goodman-Kruskal 람다(λ) 및 타우(τ)는 다른 변수의 값을 알고 있을 때 한 변수의 값을 정확하게 예측하는 능력에 근거한 연관 정도를 측정합니다. 람다는 형태 상의 확률에 기반하고 타우는 랜덤 범주 지정에 기반합니다.

해석

람다(λ)
람다는 다른 변수(행 또는 열 변수)의 값이 주어졌을 때 종속 변수(열 또는 행 변수) 예측에서 개선 비율을 측정합니다.
람다 값의 범위는 0 ~ 1입니다. 0 값은 독립 변수가 종속 변수 범주의 예측을 개선하지 않는다는 것을 의미합니다. 1 값은 독립 변수가 종속 변수의 범주를 완전히 개선한다는 것을 의미합니다. 0.5 값은 예측 오류가 50% 감소한다는 것을 의미합니다.
타우(τ)
타우는 다른 변수(행 또는 열 변수)의 값이 주어졌을 때 종속 변수(열 또는 행 변수) 예측에서 개선 비율을 측정합니다. Goodman-Kruskal 타우는 타우 통계량을 주변 또는 조건부 비율에 따라 지정된 할당 확률을 기반으로 계산한다는 것을 제외하고는 Goodman-Kruskal 람다와 같습니다.
타우 값의 범위는 −1(완전한 음의 연관성) ~ +1(완전한 양의 연관성)입니다. 0 값은 연관성이 없음을 나타냅니다.

자세한 내용은 Goodman-Kruskal 통계량의 정의에서 확인하십시오.

순서형 범주에 대한 일치성 측도

일치 및 불일치 쌍의 수
관측치 쌍 간의 관계를 설명하려면 일치 및 불일치 쌍을 사용합니다. 일치 및 불일치 쌍을 계산하기 위해 데이터는 순서형으로 간주되며, 따라서 순서형 데이터는 연구에 적합해야 합니다. 일치 및 불일치 쌍의 수는 두 순서형 변수 간의 연관성을 측정하는 Kendall의 타우 계산에 사용됩니다.
자세한 내용은 일치 및 불일치 쌍의 정의에서 확인하십시오.
Goodman-Kruskal 감마(γ)
Goodman-Kruskal 감마(γ)는 일치 쌍과 불일치 쌍의 차이를 같은 값을 갖는 쌍을 제외한 쌍의 총 수로 나눈 값입니다. Goodman-Kruskal 감마를 사용하여 순서형 변수 간의 연관성을 측정할 수 있습니다.
|γ| = 1일 때 완전한 연관성이 존재합니다. 순서형 및 이항 로지스틱 회귀 분석의 경우 X와 Y가 독립적이면 γ = 0입니다.
자세한 내용은 Goodman-Kruskal 통계량의 정의에서 확인하십시오.
Somers의 D
Somers의 D는 변수 쌍 사이의 관계에 대한 강도와 방향을 측정합니다. Somers의 D 값의 범위는 -1(모든 쌍 동일)에서 1(모든 쌍 동일) 사이입니다.
Minitab에서는 D에 대해 행 변수가 종속 변수인 경우에 대한 값 하나와 열 변수가 종속 변수인 경우에 대한 값 하나 등, 두 개의 값을 표시합니다. 어느 경우가 분석에 적절한지 결정해야 합니다.
Kendall의 타우-b
Kendall의 타우-b는 교차표에 사용되어 두 순서형 변수 간의 연관성을 측정합니다.
Kendall의 타우-b 값의 범위는 -1.0에서 1.0 사이입니다. 양수 값은 두 변수가 함께 증가함을 나타냅니다. 음수 값은 두 변수가 함께 감소함을 나타냅니다.

Pearson의 r 및 Spearman의 로

순서형 범주를 갖는 두 변수 간의 연관성을 평가하려면 Pearson의 r과 Spearman의 로를 사용합니다. 순서형 범주에는 작음, 중간, 큼 등 자연적 순서가 있습니다.

계수 값 범위가 -1부터 +1까지입니다. 계수의 절대값이 클수록 변수 사이에 강한 관계가 있습니다. 절대값 1은 완전한 관계를 나타내고 0은 순서형 관계가 없음을 나타냅니다. 중간 값은 목표와 요구 사항에 따라 약한 상관 관계, 적절한 상관 관계 또는 강한 상관 관계로 해석됩니다.

자세한 내용은 순서형 범주에 대한 Spearman의 로 및 Pearson의 r 정의에서 확인하십시오.