상관 분석에 대한 주요 결과 해석

상관 분석을 해석하려면 다음 단계를 수행하십시오. 주요 결과에는 Pearson 상관 계수, Spearman 상관 계수 및 p-값이 포함됩니다.

1단계: 산점 행렬도에서 변수 사이의 관계 조사

산점 행렬도를 사용하여 두 계량형 변수 사이의 관계를 조사합니다. 또한 관계에서 특이치도 찾아봅니다. 특이치는 Pearson 상관 계수의 결과에 커다란 영향을 미칠 수 있습니다.

관계가 선형 또는 단순인지 아니면 둘 다 아닌지 결정합니다. 다음은 상관 계수가 기술하는 형태 유형의 예입니다. Pearson 상관 계수는 선형 형태에 적합합니다. Spearman의 상관 계수는 단순 형태에 적합합니다.

아무런 관계도 없음

점들이 그림에 랜덤하게 위치합니다. 이는 변수 사이에 선형 관계가 없다는 것을 나타냅니다.

적절한 양의 관계

일부 점은 선에 가깝고 일부 점은 선에서 멀리 떨어져 있습니다. 이는 변수 사이에 적절한 선형 관계만이 있다는 것을 나타냅니다.

강한 양의 관계

점들이 선에 가깝게 위치합니다 이는 변수 사이에 강한 선형 관계가 있다는 것을 나타냅니다. 한 변수가 증가하면 다른 변수도 증가하기 때문에 양의 관계가 있습니다.

강한 음의 관계

점들이 선에 가깝게 위치합니다 이는 변수 사이에 강한 음의 선형 관계가 있다는 것을 나타냅니다. 한 변수가 증가하면 다른 변수도 감소하기 때문에 음의 관계가 있습니다.

단순

단순 관계에서 두 변수는 동일한 상대적인 방향으로 이동하는 경향이 있지만 반드시 일정한 비율로 변화하는 것은 아닙니다. 선형 관계에서 두 변수는 동일한 방향으로 일정한 비율로 이동합니다. 이 그림은 두 변수가 모두 동시에 증가하지만 같은 비율로 증가하지는 않음을 나타냅니다. 이 관계는 단순 관계지만 선형은 아닙니다. 이 데이터의 Pearson 상관 계수는 0.843이지만 Spearman 상관 계수는 더 높습니다(0.948).

곡선 2차

이 예에서는 곡선 관계를 나타냅니다. 변수 사이의 관계는 강하지만, 상관 계수가 영(0)에 가깝습니다. 관계가 선형도 아니고 단순도 아닙니다.

주요 결과: 산점도 행렬

이 결과에서는 양의 선형 관계, 음의 선형 관계, 가능한 곡선 관계, 특이치 몇 개를 확인할 수 있습니다.
  • 고용과 거주 사이에 강한 양의 선형 관계가 있습니다.
  • 신용카드와 저축 사이에는 약한 음의 선형 관계가 있습니다.
  • 부채에는 조사해야 하는 특이치가 있는 것으로 보입니다.

2단계: 변수 사이의 상관 계수 조사

두 연속형 변수 사이의 선형 관계의 강도와 방향을 조사하려면 Pearson 상관 계수를 사용합니다.

강도

상관 계수 값의 범위는 −1부터 +1까지입니다. 계수의 절대값이 클수록 변수 사이에 강한 관계가 있습니다.

Pearson 상관의 경우 절대값 1은 완전한 선형 관계를 나타냅니다. 0에 가까운 상관 값은 변수 사이에 선형 관계가 없음을 나타냅니다.
방향

계수의 부호는 관계의 방향을 나타냅니다. 두 변수가 함께 증가하거나 감소하는 경향이 있으면 계수가 양수이며, 상관을 나타내는 선이 위쪽 방향으로 기울어집니다. 한 변수가 증가할 때 다른 변수는 감소하는 경향이 있으면 계수는 음수이며, 상관을 나타내는 선이 아래쪽 방향으로 기울어집니다.

상관 계수를 해석하려면 다음과 같은 사항을 고려하십시오.
  • 상관 계수만을 기초로, 한 변수의 변화가 다른 변수의 변화를 유발한다는 결론을 내리는 것은 적절하지 않습니다. 적절히 통제된 실험에서만 인과 관계를 확인할 수 있습니다.
  • Pearson 상관 계수는 극단 데이터 값의 영향을 상당히 많이 받습니다. 데이터 집합에 나머지 값들과 매우 다른 값이 하나 있으면 상관 계수의 값이 크게 변경될 수 있습니다. 따라서 극단값의 원인을 식별해야 합니다. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오(특수 원인). 그런 다음 분석을 반복하십시오.
  • 낮은 Pearson 상관 계수는 변수 사이에 관계가 없다는 것을 의미하지 않습니다. 변수 사이에 비선형 관계가 있을 수도 있습니다.
상관 분석: 나이, 거주 기간, 근무 기간, 저축, 부채, 신용카드 수

방법

상관 계수 유형Pearson
사용된 행 수30

상관계수

나이거주 기간근무 기간저축부채
거주 기간0.838       
근무 기간0.8480.952     
저축0.5520.5700.539   
부채0.0320.1860.247-0.393 
신용카드 수-0.1300.0530.023-0.4100.474
주요 결과: Pearson 상관 계수

거주와 나이, 고용과 나이, 그리고 고용과 거주 간에 양의 선형 관계가 있습니다. 이 세 쌍의 Pearson 상관 계수는 다음과 같습니다.
  • 거주와 나이, 0.838
  • 고용과 나이, 0.848
  • 고용과 거주, 0.952
이런 값은 변수 간에 중간 정도의 양의 관계가 있음을 나타냅니다.
다음 쌍은 음의 선형 관계가 있고 Pearson 상관 계수가 음수입니다.
  • 부채와 저축, −0.393
  • 신용카드와 나이, −0.130
  • 신용카드와 저축, −0.410
이런 변수들의 상호 관계는 음수이므로 부채가 증가할수록 교육과 저축이 감소하고 신용카드가 증가할수록 저축이 감소함을 나타냅니다.