Goodman-Kruskal 통계량의 정의

Goodman-Kruskal 통계량은 범주형 변수 간의 연관성을 측정하는 측도입니다. 통계분석 > > 교차표 및 카이-제곱 검정을 선택하고 기타 통계량을 클릭하여 Goodman-Kruskal 타우와 Goodman-Kruskal 람다 통계량을 얻을 수 있습니다. 통계분석 > 회귀 분석 > 이항 로지스틱 회귀 분석 또는 통계분석 > 회귀 분석 > 순서형 로지스틱 회귀 분석을 수행하여 Goodman-Kruskal 감마를 얻을 수도 있습니다.

Goodman-Kruskal 타우의 정의

Goodman-Kruskal 타우는 명목형 수준 변수의 교차표에 대한 연관성을 측정하는 측도입니다.

Goodman-Kruskal 타우는 랜덤 범주 할당을 기반으로 합니다. 다른 변수(열 또는 행 변수)의 값이 주어졌을 때 종속 변수(열 또는 행 변수) 예측에서 개선 비율을 측정합니다. Goodman-Kruskal 타우는 타우 통계량을 주변 또는 조건부 비율에 따라 지정된 할당 확률을 기반으로 계산한다는 것을 제외하고는 Goodman-Kruskal 람다와 같습니다.

오분류 확률은 주변 또는 조건부 비율로 지정된 확률을 가진 랜덤 범주 할당에 기반합니다.

Goodman-Kruskal 람다의 정의

Goodman-Kruskal 람다는 명목형 수준 변수의 교차표에 대한 연관성을 측정합니다.

Goodman-Kruskal 람다는 형태상 확률을 기반으로 합니다. 다른 변수(행 또는 열 변수)의 값이 주어졌을 때 종속 변수(열 또는 행 변수) 예측에서 개선 비율을 측정합니다.

오분류 확률은 확률이 가장 큰 범주의 할당에 기반하여 계산됩니다. 종속 변수로서 X(행 변수)에 대한 람다는 다음과 같이 계산됩니다.
  • S는 각 행에 대해 가장 높은 셀 카운트입니다.
  • R은 가장 높은 행 합계입니다.
  • N은 전체 셀 카운트의 합계입니다.
  • 람다는 (S – R)/(N – R)의 비율입니다.

종속 변수로서 Y(열 변수)에 대한 람다를 계산하려면 이전 단계를 수행하고 S는 각 열에 대한 가장 높은 열 카운트로, R은 가장 높은 열 합계로 바꿉니다.

Goodman-Kruskal 감마의 정의

Goodman-Kruskal 감마(γ)는 일치 쌍과 불일치 쌍의 차이를 같은 값을 갖는 쌍을 제외한 쌍의 총 수로 나눈 값입니다. Goodman-Kruskal 감마를 사용하여 순서형 변수 간의 연관성을 측정할 수 있습니다.

|γ| = 1일 때 완전한 연관성이 존재합니다. 순서형 및 이항 로지스틱 회귀 분석의 경우 X와 Y가 독립적이면 γ = 0입니다.