분할표는 여러 개의 범주형 변수에 따라 관측치를 기록합니다. 이 표의 행과 열은 범주형 변수에 해당합니다. 이 표에는 변수의 각 수준에 대한 주변 총계가 포함됩니다.
단순 대응 분석에 대한 분할표는 두 변수에 대한 관측치를 기록하는 이원 표입니다. 또한결합 하위 대화 상자를 사용하여 세 개 또는 네 개의 변수에 대해 관측치를 분류하여 변수를 교차하고 이원 표의 행 및 열을 생성할 수 있습니다.
분할표를 사용하면 행 범주 및 열 범주별로 정의되는 각 셀에 대한 관측 빈도를 확인할 수 있습니다. 각 범주에 대한 전체 빈도를 확인하려면 열과 행 총계를 사용하십시오.
A | B | C | D | E | 총계 | |
---|---|---|---|---|---|---|
지질학 | 3.000 | 19.000 | 39.000 | 14.000 | 10.000 | 85.000 |
생화학 | 1.000 | 2.000 | 13.000 | 1.000 | 12.000 | 29.000 |
화학 | 6.000 | 25.000 | 49.000 | 21.000 | 29.000 | 130.000 |
동물학 | 3.000 | 15.000 | 41.000 | 35.000 | 26.000 | 120.000 |
물리학 | 10.000 | 22.000 | 47.000 | 9.000 | 26.000 | 114.000 |
공학 | 3.000 | 11.000 | 25.000 | 15.000 | 34.000 | 88.000 |
미생물학 | 1.000 | 6.000 | 14.000 | 5.000 | 11.000 | 37.000 |
식물학 | 0.000 | 12.000 | 34.000 | 17.000 | 23.000 | 86.000 |
통계학 | 2.000 | 5.000 | 11.000 | 4.000 | 7.000 | 29.000 |
수학 | 2.000 | 11.000 | 37.000 | 8.000 | 20.000 | 78.000 |
총계 | 31.000 | 128.000 | 310.000 | 129.000 | 198.000 | 796.000 |
다음 이원 분할표는 각 학문 분야와 기금 범주(A, B, C, D, E)에 해당하는 연구자의 관측 카운트를 보여줍니다. 총계 열은 대부분의 연구자가 화학(130), 동물학(120) 및 물리학(114) 분야에 있다는 것을 나타냅니다. 총계 행은 대부분의 연구자가 기금 범주 C(310)로 분류된다는 것을 나타냅니다. 셀 카운트의 경우 기금 범주 C로 분류되는 화학 분야 연구자의 관측 빈도(49)가 가장 높습니다.
기대 빈도는 변수가 서로 독립적인 경우 하나의 셀에서 기대되는 관측치의 카운트입니다. Minitab에서는 기대 카운트를 행과 열 합계의 곱을 총 관측치 수로 나눈 값으로 계산합니다.
A | B | C | D | E | |
---|---|---|---|---|---|
지질학 | 3.310 | 13.668 | 33.103 | 13.775 | 21.143 |
생화학 | 1.129 | 4.663 | 11.294 | 4.700 | 7.214 |
화학 | 5.063 | 20.905 | 50.628 | 21.068 | 32.337 |
동물학 | 4.673 | 19.296 | 46.734 | 19.447 | 29.849 |
물리학 | 4.440 | 18.332 | 44.397 | 18.475 | 28.357 |
공학 | 3.427 | 14.151 | 34.271 | 14.261 | 21.889 |
미생물학 | 1.441 | 5.950 | 14.410 | 5.996 | 9.204 |
식물학 | 3.349 | 13.829 | 33.492 | 13.937 | 21.392 |
통계학 | 1.129 | 4.663 | 11.294 | 4.700 | 7.214 |
수학 | 3.038 | 12.543 | 30.377 | 12.641 | 19.402 |
다음 기대 빈도 표는 기금과 학문 분야 간의 관계가 독립적이라는 가정에서 각 학문 분야와 기금 범주(A, B, C, D, E)의 연구자의 기대 카운트를 보여줍니다. 대부분의 연구자가 화학 분야이고 대부분의 학과가 기금 범주 C에 있기 때문에 이들 범주 조합의 기대값(약 51)이 가장 높습니다.
관측 빈도 − 기대 빈도는 셀의 실제 관측치 카운트와 변수가 서로 독립적인 경우 기대되는 셀의 관측치 카운트 간의 차이입니다.
관측 빈도와 기대 빈도 간의 차이를 사용하면 데이터에서 가능한 연관성의 증거를 찾을 수 있습니다. 두 변수가 연관되어 있으면 한 변수의 관측치 분포가 두 번째 변수의 범주에 따라 달라집니다. 그 결과, 관측 빈도와 기대 빈도 간의 크기가 비교적 큽니다. 두 변수가 독립적이면 한 변수의 관측치 분포가 두 번째 변수의 모든 범주에서 비슷합니다. 그 결과, 관측 빈도와 기대 빈도 간의 크기가 비교적 작습니다.
A | B | C | D | E | |
---|---|---|---|---|---|
지질학 | -0.310 | 5.332 | 5.897 | 0.225 | -11.143 |
생화학 | -0.129 | -2.663 | 1.706 | -3.700 | 4.786 |
화학 | 0.937 | 4.095 | -1.628 | -0.068 | -3.337 |
동물학 | -1.673 | -4.296 | -5.734 | 15.553 | -3.849 |
물리학 | 5.560 | 3.668 | 2.603 | -9.475 | -2.357 |
공학 | -0.427 | -3.151 | -9.271 | 0.739 | 12.111 |
미생물학 | -0.441 | 0.050 | -0.410 | -0.996 | 1.796 |
식물학 | -3.349 | -1.829 | 0.508 | 3.063 | 1.608 |
통계학 | 0.871 | 0.337 | -0.294 | -0.700 | -0.214 |
수학 | -1.038 | -1.543 | 6.623 | -4.641 | 0.598 |
이 표에서 관측 카운트와 기대 카운트 간 차이의 크기는 동물학과 기금 범주 D(15.553) 및 공학과 기금 범주 E(12.111)에 대해 비교적 큽니다. 이 셀들의 경우 관측 카운트는 변수가 서로 독립적인 경우 예상되는 카운트보다 큽니다. 차이의 크기는 지질학과 기금 범주 E(-11.143)에 대해서도 비교적 큽니다. 이 셀의 경우 관측 카운트는 변수가 서로 독립적인 경우 예상되는 카운트보다 큽니다. 따라서 상당히 더 많은 공학 학과가 예상보다 기금을 받지 못하고 상당히 더 적은 지질학 학과가 예상보다 기금을 받지 못했다는 결론을 내릴 수 있습니다.
Minitab에서는 카이-제곱 통계량에 대한 각 셀의 기여도를 카이-제곱 거리로 표시합니다. 각 셀에 대한 카이-제곱 거리는 총 카이-제곱 통계량 중에서 각 셀의 범주로 인한 비율을 양적으로 나타냅니다.
Minitab에서는 각 셀의 카이-제곱 통계량에 대한 기여도를 해당 셀의 관측값과 기대값의 차이 제곱을 해당 셀의 기대값으로 나누어서 계산합니다. 총 카이-제곱은 모든 셀에 대한 값의 합입니다.
각 셀에 대한 카이-제곱 거리를 비교하여 어느 셀이 총 카이-제곱에 가장 기여하는지 평가할 수 있습니다. 관측 및 기대 셀 빈도가 크게 다르면 셀에 대한 카이-제곱 값이 더 큽니다. 따라서 셀의 카이-제곱 거리가 더 클수록 행 범주와 열 범주 간의 연관성이 우연히 예상되는 것보다 더 강합니다.
A | B | C | D | E | 총계 | |
---|---|---|---|---|---|---|
지질학 | 0.029 | 2.080 | 1.050 | 0.004 | 5.873 | 9.036 |
생화학 | 0.015 | 1.521 | 0.258 | 2.913 | 3.176 | 7.882 |
화학 | 0.173 | 0.802 | 0.052 | 0.000 | 0.344 | 1.373 |
동물학 | 0.599 | 0.957 | 0.703 | 12.438 | 0.496 | 15.194 |
물리학 | 6.964 | 0.734 | 0.153 | 4.859 | 0.196 | 12.906 |
공학 | 0.053 | 0.702 | 2.508 | 0.038 | 6.700 | 10.001 |
미생물학 | 0.135 | 0.000 | 0.012 | 0.166 | 0.351 | 0.663 |
식물학 | 3.349 | 0.242 | 0.008 | 0.673 | 0.121 | 4.393 |
통계학 | 0.671 | 0.024 | 0.008 | 0.104 | 0.006 | 0.814 |
수학 | 0.354 | 0.190 | 1.444 | 1.704 | 0.018 | 3.710 |
총계 | 12.343 | 7.252 | 6.196 | 22.899 | 17.282 | 65.972 |
이 표에서 동물학과 기금 범주 D에 대한 셀은 12.438로, 총 카이-제곱에 대한 가장 큰 기여도를 설명합니다(65.972). 행 범주 중에서 동물학(15.194), 물리학(12.906) 및 공학(10.001)이 총 카이-제곱에 가장 크게 기여합니다. 열 범주 중에서 기금 수준 D(22.899)와 E(17.282)가 총 카이-제곱에 가장 크게 기여합니다.
셀 이너시아는 셀에 있는 카이-제곱 값을 분할표에 대한 총 빈도로 나눈 값입니다. 모든 셀 이너시아의 합은 전체 이너시아 또는 간단히 이너시아입니다. 셀에 대한 상대 이너시아는 셀 이너시아를 전체 이너시아로 나눈 값입니다. 행에 대한 상대 이너시아는 행에 대한 셀 이너시아의 합을 전체 이너시아로 나눈 값입니다. 열에 대한 상대 이너시아는 열에 대한 셀 이너시아의 합을 전체 이너시아로 나눈 값입니다.
상대 이너시아를 사용하면 범주 및 기여도와 데이터 변동 간 연관성의 강도를 평가할 수 있습니다. 일반적으로 값이 클수록 연관성이 더 강하고 데이터의 기대값으로부터 전체 변동의 비율이 더 크다는 것을 나타냅니다.
A | B | C | D | E | 총계 | |
---|---|---|---|---|---|---|
지질학 | 0.000 | 0.032 | 0.016 | 0.000 | 0.089 | 0.137 |
생화학 | 0.000 | 0.023 | 0.004 | 0.044 | 0.048 | 0.119 |
화학 | 0.003 | 0.012 | 0.001 | 0.000 | 0.005 | 0.021 |
동물학 | 0.009 | 0.015 | 0.011 | 0.189 | 0.008 | 0.230 |
물리학 | 0.106 | 0.011 | 0.002 | 0.074 | 0.003 | 0.196 |
공학 | 0.001 | 0.011 | 0.038 | 0.001 | 0.102 | 0.152 |
미생물학 | 0.002 | 0.000 | 0.000 | 0.003 | 0.005 | 0.010 |
식물학 | 0.051 | 0.004 | 0.000 | 0.010 | 0.002 | 0.067 |
통계학 | 0.010 | 0.000 | 0.000 | 0.002 | 0.000 | 0.012 |
수학 | 0.005 | 0.003 | 0.022 | 0.026 | 0.000 | 0.056 |
총계 | 0.187 | 0.110 | 0.094 | 0.347 | 0.262 | 1.000 |
상대 이너시아 표는 전체 카이-제곱 통계량에 대한 각 셀의 상대 기여도를 보여줍니다. 셀의 상대 이너시아가 높을수록 행 범주와 열 범주 간의 연관성이 더 큽니다. 이 표에서 동물학과 기금 범주 D에 대한 셀의 상대 이너시아(0.189)가 가장 높고, 표에서 연관성이 가장 강합니다. 표는 또한 각 행과 열에 대한 전체 상대 이너시아를 나타냅니다.