단순 대응 분석에 대한 방법

단순 대응 분석에서는 분할표의 가중 주성분 분석을 수행합니다. 분할표에 r개의 행과 c개의 열이 있는 경우 기본 차원의 수는 (r − 1)과 (c − 1) 중 작은 값입니다. 주성분과 마찬가지로 변동성이 분할되지만, 총 분산을 분할하는 대신 단순 대응 분석에서는 Pearson χ2 통계량(기본적으로 연관성에 대한 χ2 검정에서 계산된 동일한 통계량)을 분할합니다.

일반적으로 대응 분석에서는 Χ2 대신 이너시아 또는 전체 이너시아라고 하는 χ2 / n을 사용합니다. 모든 주성분과 연관된 이너시아가 전체 이너시아로 합쳐집니다. 이상적으로는 처음 한 개, 두 개 또는 세 개의 성분이 전체 이너시아의 대부분을 설명합니다.

낮은 차원의 부분공간은 주성분(주축이라고도 함)이 차지합니다. 전체 이너시아의 최대 양을 설명하도록 첫 번째 주축이 선택되고, 나머지 이너시아의 최대 양을 설명하도록 두 번째 주축이 선택되며 이런 식으로 계속됩니다. 첫 번째 주축이 (적절한 측도를 사용하는 프로파일에 가장 가까운) 최적의 1차원 부분공간을 차지하며, 처음 두 주축이 최적의 2차원 부분공간을 차지하고, 이런 식으로 계속됩니다. 이 부분공간들은 내포된 상태로, 최적의 1차원 부분공간이 최적의 2차원 부분공간의 부분공간이며, 이런 식으로 계속됩니다.

행 프로파일 i 및 성분(축) k에 대한 주좌표는 행 프로파일 i의 성분 k에 대한 투영의 좌표입니다. 성분 k에 대한 행 표준화 좌표는 성분 k에 대한 주좌표를 k번째 이너시아의 제곱근으로 나눈 값입니다.

마찬가지로 열 프로파일 j 및 성분 k에 대한 주좌표는 열 프로파일 j의 성분 k에 대한 투영의 좌표입니다. 성분 k에 대한 열 표준화 좌표는 성분 k에 대한 주좌표를 k번째 이너시아의 제곱근으로 나눈 값입니다.

분할표는 행 프로파일 또는 열 프로파일의 관점에서 분석할 수 있습니다. 행 프로파일은 분할표의 카운트에서 계산된 행 비율 리스트입니다. 구체적으로 i행에 대한 프로파일은 (ni1 / ni., ni2 / ni., ... , nic / ni.)입니다. 열 프로파일은 열 비율 리스트로, 여기서 nij는 표의 i행과 j열에 있는 빈도이고 ni.는 i행에 있는 빈도의 합입니다. 구체적으로 j열에 대한 프로파일은 (n1j / n.j, n2j / n.j, ... , nrj / n.j)이며, 여기서 n.j는 j열에 있는 빈도의 합입니다.

두 분석은 수학적으로 동일합니다. 사용하는 분석은 연구에 따라 다릅니다. 대부분의 경우 연구자는 행 프로파일이 서로 다른지 또는 열 프로파일이 서로 다른지 연구하는 데 관심이 있습니다.

행 프로파일은 길이가 c인 벡터이므로 c차원 공간에 위치합니다(마찬가지로, 열 프로파일은 r차원 공간에 위치함). 이 차원은 일반적으로 너무 높아 쉽게 해석할 수 없으므로 모든 행 프로파일 점(또는 열 프로파일 점)에 가까운 더 낮은 차원의 (두 개 또는 세 개 이하의) 부분공간을 찾아봐야 합니다. 그런 다음 프로파일 점들을 이 부분공간에 투영하고 투영을 연구할 수 있습니다. 투영이 프로파일에 가까우면 손실되는 정보가 많지 않습니다. 2차원 또는 3차원에서 작업하면 데이터를 더 쉽게 연구할 수 있고, 특히 그림을 조사할 수 있습니다. 이 과정은 계량형 데이터의 변동성을 요약하기 위해 몇 개의 주성분을 선택하는 것과 유사합니다.

d = (r − 1)과 (c − 1) 중 작은 값인 경우, 행 프로파일(또는 열 프로파일)은 전체 c차원 공간(또는 전체 r차원 공간)의 d차원 부분공간에 위치합니다. 따라서 최대 d개의 주성분이 있습니다.