단순 대응 분석에 대한 빈도 및 카이-제곱 거리

단순 대응 분석의 빈도 및 카이-제곱 거리에 대해 제공되는 모든 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

분할표

분할표는 여러 개의 범주형 변수에 따라 관측치를 기록합니다. 이 표의 행과 열은 범주형 변수에 해당합니다. 이 표에는 변수의 각 수준에 대한 주변 총계가 포함됩니다.

단순 대응 분석에 대한 분할표는 두 변수에 대한 관측치를 기록하는 이원 표입니다. 또한결합 하위 대화 상자를 사용하여 세 개 또는 네 개의 변수에 대해 관측치를 분류하여 변수를 교차하고 이원 표의 행 및 열을 생성할 수 있습니다.

해석

분할표를 사용하면 행 범주 및 열 범주별로 정의되는 각 셀에 대한 관측 빈도를 확인할 수 있습니다. 각 범주에 대한 전체 빈도를 확인하려면 열과 행 총계를 사용하십시오.

분할표 A B C D E 총계 지질학 3.000 19.000 39.000 14.000 10.000 85.000 생화학 1.000 2.000 13.000 1.000 12.000 29.000 화학 6.000 25.000 49.000 21.000 29.000 130.000 동물학 3.000 15.000 41.000 35.000 26.000 120.000 물리학 10.000 22.000 47.000 9.000 26.000 114.000 공학 3.000 11.000 25.000 15.000 34.000 88.000 미생물학 1.000 6.000 14.000 5.000 11.000 37.000 식물학 0.000 12.000 34.000 17.000 23.000 86.000 통계학 2.000 5.000 11.000 4.000 7.000 29.000 수학 2.000 11.000 37.000 8.000 20.000 78.000 총계 31.000 128.000 310.000 129.000 198.000 796.000

다음 이원 분할표는 각 학문 분야와 기금 범주(A, B, C, D, E)에 해당하는 연구자의 관측 카운트를 보여줍니다. 총계 열은 대부분의 연구자가 화학(130), 동물학(120) 및 물리학(114) 분야에 있다는 것을 나타냅니다. 총계 행은 대부분의 연구자가 기금 범주 C(310)로 분류된다는 것을 나타냅니다. 셀 카운트의 경우 기금 범주 C로 분류되는 화학 분야 연구자의 관측 빈도(49)가 가장 높습니다.

기대 빈도

기대 빈도는 변수가 서로 독립적인 경우 하나의 셀에서 기대되는 관측치의 카운트입니다. Minitab에서는 기대 카운트를 행과 열 합계의 곱을 총 관측치 수로 나눈 값으로 계산합니다.

기대 빈도 A B C D E 지질학 3.310 13.668 33.103 13.775 21.143 생화학 1.129 4.663 11.294 4.700 7.214 화학 5.063 20.905 50.628 21.068 32.337 동물학 4.673 19.296 46.734 19.447 29.849 물리학 4.440 18.332 44.397 18.475 28.357 공학 3.427 14.151 34.271 14.261 21.889 미생물학 1.441 5.950 14.410 5.996 9.204 식물학 3.349 13.829 33.492 13.937 21.392 통계학 1.129 4.663 11.294 4.700 7.214 수학 3.038 12.543 30.377 12.641 19.402

다음 기대 빈도 표는 기금과 학문 분야 간의 관계가 독립적이라는 가정에서 각 학문 분야와 기금 범주(A, B, C, D, E)의 연구자의 기대 카운트를 보여줍니다. 대부분의 연구자가 화학 분야이고 대부분의 학과가 기금 범주 C에 있기 때문에 이들 범주 조합의 기대값(약 51)이 가장 높습니다.

관측 빈도 - 기대 빈도

관측 빈도 − 기대 빈도는 셀의 실제 관측치 카운트와 변수가 서로 독립적인 경우 기대되는 셀의 관측치 카운트 간의 차이입니다.

해석

관측 빈도와 기대 빈도 간의 차이를 사용하면 데이터에서 가능한 연관성의 증거를 찾을 수 있습니다. 두 변수가 연관되어 있으면 한 변수의 관측치 분포가 두 번째 변수의 범주에 따라 달라집니다. 그 결과, 관측 빈도와 기대 빈도 간의 크기가 비교적 큽니다. 두 변수가 독립적이면 한 변수의 관측치 분포가 두 번째 변수의 모든 범주에서 비슷합니다. 그 결과, 관측 빈도와 기대 빈도 간의 크기가 비교적 작습니다.

관측 빈도 - 기대 빈도 A B C D E 지질학 -0.310 5.332 5.897 0.225 -11.143 생화학 -0.129 -2.663 1.706 -3.700 4.786 화학 0.937 4.095 -1.628 -0.068 -3.337 동물학 -1.673 -4.296 -5.734 15.553 -3.849 물리학 5.560 3.668 2.603 -9.475 -2.357 공학 -0.427 -3.151 -9.271 0.739 12.111 미생물학 -0.441 0.050 -0.410 -0.996 1.796 식물학 -3.349 -1.829 0.508 3.063 1.608 통계학 0.871 0.337 -0.294 -0.700 -0.214 수학 -1.038 -1.543 6.623 -4.641 0.598

이 표에서 관측 카운트와 기대 카운트 간 차이의 크기는 동물학과 기금 범주 D(15.553) 및 공학과 기금 범주 E(12.111)에 대해 비교적 큽니다. 이 셀들의 경우 관측 카운트는 변수가 서로 독립적인 경우 예상되는 카운트보다 큽니다. 차이의 크기는 지질학과 기금 범주 E(-11.143)에 대해서도 비교적 큽니다. 이 셀의 경우 관측 카운트는 변수가 서로 독립적인 경우 예상되는 카운트보다 큽니다. 따라서 상당히 더 많은 공학 학과가 예상보다 기금을 받지 못하고 상당히 더 적은 지질학 학과가 예상보다 기금을 받지 못했다는 결론을 내릴 수 있습니다.

카이-제곱 거리

Minitab에서는 카이-제곱 통계량에 대한 각 셀의 기여도를 카이-제곱 거리로 표시합니다. 각 셀에 대한 카이-제곱 거리는 총 카이-제곱 통계량 중에서 각 셀의 범주로 인한 비율을 양적으로 나타냅니다.

Minitab에서는 각 셀의 카이-제곱 통계량에 대한 기여도를 해당 셀의 관측값과 기대값의 차이 제곱을 해당 셀의 기대값으로 나누어서 계산합니다. 총 카이-제곱은 모든 셀에 대한 값의 합입니다.

해석

각 셀에 대한 카이-제곱 거리를 비교하여 어느 셀이 총 카이-제곱에 가장 기여하는지 평가할 수 있습니다. 관측 및 기대 셀 빈도가 크게 다르면 셀에 대한 카이-제곱 값이 더 큽니다. 따라서 셀의 카이-제곱 거리가 더 클수록 행 범주와 열 범주 간의 연관성이 우연히 예상되는 것보다 더 강합니다.

카이-제곱 거리 A B C D E 총계 지질학 0.029 2.080 1.050 0.004 5.873 9.036 생화학 0.015 1.521 0.258 2.913 3.176 7.882 화학 0.173 0.802 0.052 0.000 0.344 1.373 동물학 0.599 0.957 0.703 12.438 0.496 15.194 물리학 6.964 0.734 0.153 4.859 0.196 12.906 공학 0.053 0.702 2.508 0.038 6.700 10.001 미생물학 0.135 0.000 0.012 0.166 0.351 0.663 식물학 3.349 0.242 0.008 0.673 0.121 4.393 통계학 0.671 0.024 0.008 0.104 0.006 0.814 수학 0.354 0.190 1.444 1.704 0.018 3.710 총계 12.343 7.252 6.196 22.899 17.282 65.972

이 표에서 동물학과 기금 범주 D에 대한 셀은 12.438로, 총 카이-제곱에 대한 가장 큰 기여도를 설명합니다(65.972). 행 범주 중에서 동물학(15.194), 물리학(12.906) 및 공학(10.001)이 총 카이-제곱에 가장 크게 기여합니다. 열 범주 중에서 기금 수준 D(22.899)와 E(17.282)가 총 카이-제곱에 가장 크게 기여합니다.

상대 이너시아

셀 이너시아는 셀에 있는 카이-제곱 값을 분할표에 대한 총 빈도로 나눈 값입니다. 모든 셀 이너시아의 합은 전체 이너시아 또는 간단히 이너시아입니다. 셀에 대한 상대 이너시아는 셀 이너시아를 전체 이너시아로 나눈 값입니다. 행에 대한 상대 이너시아는 행에 대한 셀 이너시아의 합을 전체 이너시아로 나눈 값입니다. 열에 대한 상대 이너시아는 열에 대한 셀 이너시아의 합을 전체 이너시아로 나눈 값입니다.

해석

상대 이너시아를 사용하면 범주 및 기여도와 데이터 변동 간 연관성의 강도를 평가할 수 있습니다. 일반적으로 값이 클수록 연관성이 더 강하고 데이터의 기대값으로부터 전체 변동의 비율이 더 크다는 것을 나타냅니다.

상대 이너시아 A B C D E 총계 지질학 0.000 0.032 0.016 0.000 0.089 0.137 생화학 0.000 0.023 0.004 0.044 0.048 0.119 화학 0.003 0.012 0.001 0.000 0.005 0.021 동물학 0.009 0.015 0.011 0.189 0.008 0.230 물리학 0.106 0.011 0.002 0.074 0.003 0.196 공학 0.001 0.011 0.038 0.001 0.102 0.152 미생물학 0.002 0.000 0.000 0.003 0.005 0.010 식물학 0.051 0.004 0.000 0.010 0.002 0.067 통계학 0.010 0.000 0.000 0.002 0.000 0.012 수학 0.005 0.003 0.022 0.026 0.000 0.056 총계 0.187 0.110 0.094 0.347 0.262 1.000

상대 이너시아 표는 전체 카이-제곱 통계량에 대한 각 셀의 상대 기여도를 보여줍니다. 셀의 상대 이너시아가 높을수록 행 범주와 열 범주 간의 연관성이 더 큽니다. 이 표에서 동물학과 기금 범주 D에 대한 셀의 상대 이너시아(0.189)가 가장 높고, 표에서 연관성이 가장 강합니다. 표는 또한 각 행과 열에 대한 전체 상대 이너시아를 나타냅니다.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오