주성분 분석에 대한 주요 결과 해석

주성분 분석을 해석하려면 다음 단계를 수행하십시오. 주요 결과에는 고유값, 성분이 설명하는 분산의 비율, 계수 및 여러 그래프가 포함됩니다.

1단계: 주성분의 수 결정

다음 방법을 사용하여 대부분의 데이터 변동을 설명하는 주성분의 최소 수를 결정합니다.
성분들이 설명하는 분산의 비율
누적 비율을 사용하면 주성분들이 설명하는 전체 분산 양을 확인할 수 있습니다. 허용 가능한 분산의 수준을 설명하는 주성분을 유지합니다. 허용 수준은 연구에 따라 다릅니다. 설명을 위해서는 80%의 설명된 분산만 필요할 수 있습니다. 그러나 데이터에 대해 다른 분석을 수행하는 경우에는 주성분들이 분산의 90% 이상을 설명할 수도 있습니다.
고유값
고유값 크기를 사용하여 주성분 수를 결정할 수 있습니다. 고유값이 가장 큰 주성분을 유지합니다. 예를 들어, Kaiser 기준을 사용하는 경우 고유값이 1보다 큰 주성분만 사용합니다.
Scree 그림
Scree 그림은 고유값을 가장 큰 값에서 가장 작은 값의 순서로 정렬합니다. 이상적인 패턴은 기울기가 큰 곡선 다음에 완만한 곡선이 나오고 직선이 이어지는 형태입니다. 선 형태가 시작되는 첫 번째 점 이전의 기울기가 큰 곡선에 있는 성분을 사용하십시오.

상관 행렬에 대한 고유 분석

고유값3.54762.13201.04470.53150.41120.16650.12540.0411
비율0.4430.2660.1310.0660.0510.0210.0160.005
누적0.4430.7100.8410.9070.9580.9790.9951.000

고유 벡터

변수PC1PC2PC3PC4PC5PC6PC7PC8
수입0.3140.145-0.676-0.347-0.2410.4940.018-0.030
교육 수준0.2370.444-0.4010.2400.622-0.3570.1030.057
나이0.484-0.135-0.004-0.212-0.175-0.487-0.657-0.052
거주 기간0.466-0.2770.0910.116-0.035-0.0850.487-0.662
근무 기간0.459-0.3040.122-0.017-0.014-0.0230.3680.739
저축0.4040.2190.3660.4360.1430.568-0.348-0.017
부채-0.067-0.585-0.078-0.2810.6810.245-0.196-0.075
신용카드 수-0.123-0.452-0.4680.703-0.195-0.022-0.1580.058
주요 결과: 누적, 고유값, Scree 그림

이 결과에서는 처음 세 주성분의 값이 1보다 큽니다. 이 세 성분이 데이터 변동의 84.1%를 설명합니다. Scree 그림은 고유값들이 세 번째 주성분 다음에 직선을 형성하기 시작한다는 것을 보여줍니다. 84.1%가 데이터에서 설명되는 적절한 변동량인 경우 처음 세 주성분을 사용해야 합니다.

2단계: 원래 변수의 관점에서 각 주성분 해석

각 주성분을 해석하려면 원래 변수에 대한 계수의 크기와 계수를 조사합니다. 계수의 절대값이 클수록 성분을 계산할 때 해당 변수의 중요성도 커집니다. 중요한 것으로 간주되기 위한 계수의 절대값 크기는 주관적입니다. 상관 계수 값이 중요한 수준을 확인하려면 전문 지식을 활용합니다.

상관 행렬에 대한 고유 분석

고유값3.54762.13201.04470.53150.41120.16650.12540.0411
비율0.4430.2660.1310.0660.0510.0210.0160.005
누적0.4430.7100.8410.9070.9580.9790.9951.000

고유 벡터

변수PC1PC2PC3PC4PC5PC6PC7PC8
수입0.3140.145-0.676-0.347-0.2410.4940.018-0.030
교육 수준0.2370.444-0.4010.2400.622-0.3570.1030.057
나이0.484-0.135-0.004-0.212-0.175-0.487-0.657-0.052
거주 기간0.466-0.2770.0910.116-0.035-0.0850.487-0.662
근무 기간0.459-0.3040.122-0.017-0.014-0.0230.3680.739
저축0.4040.2190.3660.4360.1430.568-0.348-0.017
부채-0.067-0.585-0.078-0.2810.6810.245-0.196-0.075
신용카드 수-0.123-0.452-0.4680.703-0.195-0.022-0.1580.058
주요 결과: PC, 적재 그림

이 결과에서 첫 번째 주성분은 나이, 거주, 직장 및 저축과 큰 양의 연관성이 있으므로 주로 장기적인 재정 안정성을 측정합니다. 두 번째 성분은 부채 및 신용카드와 큰 음의 연관성이 있으므로 주로 신청자의 신용 정보를 측정합니다. 세 번째 성분은 수입, 교육 수준 및 신용카드와 큰 음의 연관성이 있으므로 주로 신청자의 교육 및 직업 조건을 측정합니다.

적재 그림은 처음 두 성분의 결과를 시각적으로 보여줍니다. 나이, 거주, 직장 및 저축은 성분 1에 큰 음의 적재가 되므로 이 성분은 장기적인 재정 안정성을 측정합니다. 부채 및 신용카드는 성분 2에 큰 음의 적재가 되므로 이 성분은 주로 신청자의 신용 정보를 측정합니다.

3단계: 특이치 식별

특이치 그림을 사용하면 특이치를 식별할 수 있습니다. 기준선 위에 있는 점은 특이치입니다. 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 따라서 데이터의 특이치를 식별하는 경우 해당 값이 왜 비정상적인지 이해하려면 관측치를 조사해야 합니다. 모든 측정 오류 또는 데이터 입력 오류를 수정하십시오. 특수 원인과 관련된 데이터를 제거하고 분석을 다시 실행해 보십시오.

주요 결과: 특이치 그림

이 결과에는 특이치가 없습니다. 모든 점이 기준선 아래에 있습니다.

관측치를 식별하려면 특이치 그림의 점 위에 포인터를 놓으십시오. 그림의 여러 특이치를 브러시하고 워크시트의 관측치를 표시하려면 편집기 > 브러시을 사용하십시오.