산점 행렬도를 사용하여 두 계량형 변수 사이의 관계를 조사합니다. 또한 관계에서 특이치도 찾아봅니다. 특이치는 Pearson 상관 계수의 결과에 커다란 영향을 미칠 수 있습니다.
관계가 선형 또는 단순인지 아니면 둘 다 아닌지 결정합니다. 다음은 상관 계수가 기술하는 형태 유형의 예입니다. Pearson 상관 계수는 선형 형태에 적합합니다. Spearman의 상관 계수는 단순 형태에 적합합니다.
점들이 그림에 랜덤하게 위치합니다. 이는 변수 사이에 선형 관계가 없다는 것을 나타냅니다.
일부 점은 선에 가깝고 일부 점은 선에서 멀리 떨어져 있습니다. 이는 변수 사이에 적절한 선형 관계만이 있다는 것을 나타냅니다.
점들이 선에 가깝게 위치합니다 이는 변수 사이에 강한 선형 관계가 있다는 것을 나타냅니다. 한 변수가 증가하면 다른 변수도 증가하기 때문에 양의 관계가 있습니다.
점들이 선에 가깝게 위치합니다 이는 변수 사이에 강한 음의 선형 관계가 있다는 것을 나타냅니다. 한 변수가 증가하면 다른 변수도 감소하기 때문에 음의 관계가 있습니다.
단순 관계에서 두 변수는 동일한 상대적인 방향으로 이동하는 경향이 있지만 반드시 일정한 비율로 변화하는 것은 아닙니다. 선형 관계에서 두 변수는 동일한 방향으로 일정한 비율로 이동합니다. 이 그림은 두 변수가 모두 동시에 증가하지만 같은 비율로 증가하지는 않음을 나타냅니다. 이 관계는 단순 관계지만 선형은 아닙니다. 이 데이터의 Pearson 상관 계수는 0.843이지만 Spearman 상관 계수는 더 높습니다(0.948).
이 예에서는 곡선 관계를 나타냅니다. 변수 사이의 관계는 강하지만, 상관 계수가 영(0)에 가깝습니다. 관계가 선형도 아니고 단순도 아닙니다.
두 연속형 변수 사이의 선형 관계의 강도와 방향을 조사하려면 Pearson 상관 계수를 사용합니다.
상관 계수 값의 범위는 −1부터 +1까지입니다. 계수의 절대값이 클수록 변수 사이에 강한 관계가 있습니다.
Pearson 상관의 경우 절대값 1은 완전한 선형 관계를 나타냅니다. 0에 가까운 상관 값은 변수 사이에 선형 관계가 없음을 나타냅니다.계수의 부호는 관계의 방향을 나타냅니다. 두 변수가 함께 증가하거나 감소하는 경향이 있으면 계수가 양수이며, 상관을 나타내는 선이 위쪽 방향으로 기울어집니다. 한 변수가 증가할 때 다른 변수는 감소하는 경향이 있으면 계수는 음수이며, 상관을 나타내는 선이 아래쪽 방향으로 기울어집니다.
상관 계수 유형 | Pearson |
---|---|
사용된 행 수 | 30 |
나이 | 거주 기간 | 근무 기간 | 저축 | 부채 | |
---|---|---|---|---|---|
거주 기간 | 0.838 | ||||
근무 기간 | 0.848 | 0.952 | |||
저축 | 0.552 | 0.570 | 0.539 | ||
부채 | 0.032 | 0.186 | 0.247 | -0.393 | |
신용카드 수 | -0.130 | 0.053 | 0.023 | -0.410 | 0.474 |