공분산은 두 변수 사이의 선형 관계를 측정합니다. 공분산은 두 변수 사이의 상관과 유사하지만, 다음과 같은 차이가 있습니다.
  • 상관 계수는 표준화됩니다. 따라서 완전한 선형 관계의 경우 계수가 1입니다. 상관은 두 변수 사이의 강도와 방향을 모두 측정합니다.
  • 공분산 값은 표준화되지 않습니다. 따라서 공분산의 범위는 음의 무한대에서 양의 무한대까지입니다. 완전한 선형 관계에 대한 값은 데이터에 따라 달라집니다. 데이터가 표준화되지 않기 때문에 변수 사이 관계의 강도를 확인할 수 없습니다.

공분산을 사용하여 변수 사이 관계의 방향을 확인할 수 있습니다. 양의 공분산 값은 한 변수의 평균 이상 값이 다른 변수의 평균 이상 값에 연관되어 있으며, 평균 이하의 값도 서로 비슷하게 연관되어 있음을 나타냅니다. 음의 공분산 값은 한 변수의 평균 값이 다른 변수의 평균 이하 값에 연관되어 있음을 나타냅니다.

상관 계수는 공분산을 사용하여 계산됩니다. 상관 계수는 공분산을 변수의 표준 편차 곱으로 나눈 값입니다. 따라서 공분산이 양수이면 상관 계수는 항상 양수가 되고 공분산이 음수이면 상관 계수는 항상 음수가 됩니다.