단순 대응 분석에 대한 빈도 및 카이-제곱 거리

단순 대응 분석의 빈도 및 카이-제곱 거리에 대해 제공되는 모든 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

분할표

분할표는 여러 개의 범주형 변수에 따라 관측치를 기록합니다. 이 표의 행과 열은 범주형 변수에 해당합니다. 이 표에는 변수의 각 수준에 대한 주변 총계가 포함됩니다.

단순 대응 분석에 대한 분할표는 두 변수에 대한 관측치를 기록하는 이원 표입니다. 또한결합 하위 대화 상자를 사용하여 세 개 또는 네 개의 변수에 대해 관측치를 분류하여 변수를 교차하고 이원 표의 행 및 열을 생성할 수 있습니다.

해석

분할표를 사용하면 행 범주 및 열 범주별로 정의되는 각 셀에 대한 관측 빈도를 확인할 수 있습니다. 각 범주에 대한 전체 빈도를 확인하려면 열과 행 총계를 사용하십시오.

분할표

ABCDE총계
지질학3.00019.00039.00014.00010.00085.000
생화학1.0002.00013.0001.00012.00029.000
화학6.00025.00049.00021.00029.000130.000
동물학3.00015.00041.00035.00026.000120.000
물리학10.00022.00047.0009.00026.000114.000
공학3.00011.00025.00015.00034.00088.000
미생물학1.0006.00014.0005.00011.00037.000
식물학0.00012.00034.00017.00023.00086.000
통계학2.0005.00011.0004.0007.00029.000
수학2.00011.00037.0008.00020.00078.000
총계31.000128.000310.000129.000198.000796.000

다음 이원 분할표는 각 학문 분야와 기금 범주(A, B, C, D, E)에 해당하는 연구자의 관측 카운트를 보여줍니다. 총계 열은 대부분의 연구자가 화학(130), 동물학(120) 및 물리학(114) 분야에 있다는 것을 나타냅니다. 총계 행은 대부분의 연구자가 기금 범주 C(310)로 분류된다는 것을 나타냅니다. 셀 카운트의 경우 기금 범주 C로 분류되는 화학 분야 연구자의 관측 빈도(49)가 가장 높습니다.

기대 빈도

기대 빈도는 변수가 서로 독립적인 경우 하나의 셀에서 기대되는 관측치의 카운트입니다. Minitab에서는 기대 카운트를 행과 열 합계의 곱을 총 관측치 수로 나눈 값으로 계산합니다.

기대 빈도

ABCDE
지질학3.31013.66833.10313.77521.143
생화학1.1294.66311.2944.7007.214
화학5.06320.90550.62821.06832.337
동물학4.67319.29646.73419.44729.849
물리학4.44018.33244.39718.47528.357
공학3.42714.15134.27114.26121.889
미생물학1.4415.95014.4105.9969.204
식물학3.34913.82933.49213.93721.392
통계학1.1294.66311.2944.7007.214
수학3.03812.54330.37712.64119.402

다음 기대 빈도 표는 기금과 학문 분야 간의 관계가 독립적이라는 가정에서 각 학문 분야와 기금 범주(A, B, C, D, E)의 연구자의 기대 카운트를 보여줍니다. 대부분의 연구자가 화학 분야이고 대부분의 학과가 기금 범주 C에 있기 때문에 이들 범주 조합의 기대값(약 51)이 가장 높습니다.

관측 빈도 - 기대 빈도

관측 빈도 − 기대 빈도는 셀의 실제 관측치 카운트와 변수가 서로 독립적인 경우 기대되는 셀의 관측치 카운트 간의 차이입니다.

해석

관측 빈도와 기대 빈도 간의 차이를 사용하면 데이터에서 가능한 연관성의 증거를 찾을 수 있습니다. 두 변수가 연관되어 있으면 한 변수의 관측치 분포가 두 번째 변수의 범주에 따라 달라집니다. 그 결과, 관측 빈도와 기대 빈도 간의 크기가 비교적 큽니다. 두 변수가 독립적이면 한 변수의 관측치 분포가 두 번째 변수의 모든 범주에서 비슷합니다. 그 결과, 관측 빈도와 기대 빈도 간의 크기가 비교적 작습니다.

관측 빈도 - 기대 빈도

ABCDE
지질학-0.3105.3325.8970.225-11.143
생화학-0.129-2.6631.706-3.7004.786
화학0.9374.095-1.628-0.068-3.337
동물학-1.673-4.296-5.73415.553-3.849
물리학5.5603.6682.603-9.475-2.357
공학-0.427-3.151-9.2710.73912.111
미생물학-0.4410.050-0.410-0.9961.796
식물학-3.349-1.8290.5083.0631.608
통계학0.8710.337-0.294-0.700-0.214
수학-1.038-1.5436.623-4.6410.598

이 표에서 관측 카운트와 기대 카운트 간 차이의 크기는 동물학과 기금 범주 D(15.553) 및 공학과 기금 범주 E(12.111)에 대해 비교적 큽니다. 이 셀들의 경우 관측 카운트는 변수가 서로 독립적인 경우 예상되는 카운트보다 큽니다. 차이의 크기는 지질학과 기금 범주 E(-11.143)에 대해서도 비교적 큽니다. 이 셀의 경우 관측 카운트는 변수가 서로 독립적인 경우 예상되는 카운트보다 큽니다. 따라서 상당히 더 많은 공학 학과가 예상보다 기금을 받지 못하고 상당히 더 적은 지질학 학과가 예상보다 기금을 받지 못했다는 결론을 내릴 수 있습니다.

카이-제곱 거리

Minitab에서는 카이-제곱 통계량에 대한 각 셀의 기여도를 카이-제곱 거리로 표시합니다. 각 셀에 대한 카이-제곱 거리는 총 카이-제곱 통계량 중에서 각 셀의 범주로 인한 비율을 양적으로 나타냅니다.

Minitab에서는 각 셀의 카이-제곱 통계량에 대한 기여도를 해당 셀의 관측값과 기대값의 차이 제곱을 해당 셀의 기대값으로 나누어서 계산합니다. 총 카이-제곱은 모든 셀에 대한 값의 합입니다.

해석

각 셀에 대한 카이-제곱 거리를 비교하여 어느 셀이 총 카이-제곱에 가장 기여하는지 평가할 수 있습니다. 관측 및 기대 셀 빈도가 크게 다르면 셀에 대한 카이-제곱 값이 더 큽니다. 따라서 셀의 카이-제곱 거리가 더 클수록 행 범주와 열 범주 간의 연관성이 우연히 예상되는 것보다 더 강합니다.

카이-제곱 거리

ABCDE총계
지질학0.0292.0801.0500.0045.8739.036
생화학0.0151.5210.2582.9133.1767.882
화학0.1730.8020.0520.0000.3441.373
동물학0.5990.9570.70312.4380.49615.194
물리학6.9640.7340.1534.8590.19612.906
공학0.0530.7022.5080.0386.70010.001
미생물학0.1350.0000.0120.1660.3510.663
식물학3.3490.2420.0080.6730.1214.393
통계학0.6710.0240.0080.1040.0060.814
수학0.3540.1901.4441.7040.0183.710
총계12.3437.2526.19622.89917.28265.972

이 표에서 동물학과 기금 범주 D에 대한 셀은 12.438로, 총 카이-제곱에 대한 가장 큰 기여도를 설명합니다(65.972). 행 범주 중에서 동물학(15.194), 물리학(12.906) 및 공학(10.001)이 총 카이-제곱에 가장 크게 기여합니다. 열 범주 중에서 기금 수준 D(22.899)와 E(17.282)가 총 카이-제곱에 가장 크게 기여합니다.

상대 이너시아

셀 이너시아는 셀에 있는 카이-제곱 값을 분할표에 대한 총 빈도로 나눈 값입니다. 모든 셀 이너시아의 합은 전체 이너시아 또는 간단히 이너시아입니다. 셀에 대한 상대 이너시아는 셀 이너시아를 전체 이너시아로 나눈 값입니다. 행에 대한 상대 이너시아는 행에 대한 셀 이너시아의 합을 전체 이너시아로 나눈 값입니다. 열에 대한 상대 이너시아는 열에 대한 셀 이너시아의 합을 전체 이너시아로 나눈 값입니다.

해석

상대 이너시아를 사용하면 범주 및 기여도와 데이터 변동 간 연관성의 강도를 평가할 수 있습니다. 일반적으로 값이 클수록 연관성이 더 강하고 데이터의 기대값으로부터 전체 변동의 비율이 더 크다는 것을 나타냅니다.

상대 이너시아

ABCDE총계
지질학0.0000.0320.0160.0000.0890.137
생화학0.0000.0230.0040.0440.0480.119
화학0.0030.0120.0010.0000.0050.021
동물학0.0090.0150.0110.1890.0080.230
물리학0.1060.0110.0020.0740.0030.196
공학0.0010.0110.0380.0010.1020.152
미생물학0.0020.0000.0000.0030.0050.010
식물학0.0510.0040.0000.0100.0020.067
통계학0.0100.0000.0000.0020.0000.012
수학0.0050.0030.0220.0260.0000.056
총계0.1870.1100.0940.3470.2621.000

상대 이너시아 표는 전체 카이-제곱 통계량에 대한 각 셀의 상대 기여도를 보여줍니다. 셀의 상대 이너시아가 높을수록 행 범주와 열 범주 간의 연관성이 더 큽니다. 이 표에서 동물학과 기금 범주 D에 대한 셀의 상대 이너시아(0.189)가 가장 높고, 표에서 연관성이 가장 강합니다. 표는 또한 각 행과 열에 대한 전체 상대 이너시아를 나타냅니다.