한 은행에서 수입, 교육 수준, 나이, 현 거주지에서 거주한 기간, 현 직장에서 일한 기간, 저축, 부채 및 신용카드 수 등 8가지 정보를 대출 신청자에게 요구합니다. 한 은행 관리자가 이 데이터를 분석하여 데이터를 분류하고 보고하기 위한 최상의 방법을 결정하려고 합니다. 이 관리자는 대출 신청자 30명으로부터 이 데이터를 수집합니다.

은행 관리자는 각 변수 쌍 간의 선형 관계의 강도와 방향을 조사하기 위해 Pearson 상관을 사용합니다.

  1. 표본 데이터를 엽니다 대출신청자.MTW.
  2. 통계분석 > 기초 통계 > 상관 분석을 선택합니다.
  3. 변수나이 거주 기간 근무 기간 저축 부채 '신용카드 수'을 입력합니다.
  4. 그래프을(를) 클릭합니다.
  5. 그림에 표시할 통계량에서 상관 및 구간을 선택합니다.
  6. 각 대화 상자에서 확인을 클릭합니다.

결과 해석

산점도 행렬은 변수의 각 조합 사이의 관계를 시각적으로 측정하는 데 사용합니다. 관계는 선형 또는 단순이거나 둘 다 아닐 수 있습니다.
  • 고용과 거주 사이의 Pearson 상관 계수가 가장 높습니다. 이 0.952 값은 변수 간에 양의 관계가 있음을 나타냅니다. 고용이 증가할수록 거주도 증가합니다. 95% 신뢰 구간은 0.901 − 0.977입니다.
  • 신용카드와 저축 사이의 Pearson 상관 계수는 –0.410입니다. 신용카드 수가 증가할수록 저축이 감소하는 경향이 있습니다. 95% 신뢰 구간 범위는 –0.671에서 –0.059까지입니다.

결과에 큰 영향을 미칠 수 있는 특이치를 찾는 데도 산점도 행렬을 사용합니다. 예를 들어 6번 행에는 변수 간 상관 관계에 영향을 미칠 수 있는 극단적인 데이터 점이 있습니다. 부채와 나이 그림에서 관련 예를 확인할 수 있습니다.

일반적으로 상관 관계가 강할수록 신뢰 구간이 좁습니다. 예를 들어 신용카드와 나이의 상관 관계는 약하고 95% 신뢰 구간 범위는 -0.468에서 0.242까지입니다.

상관 분석: 나이, 거주 기간, 근무 기간, 저축, 부채, 신용카드 수

방법

상관 계수 유형Pearson
사용된 행 수30

상관계수

나이거주 기간근무 기간저축부채
거주 기간0.838       
근무 기간0.8480.952     
저축0.5520.5700.539   
부채0.0320.1860.247-0.393 
신용카드 수-0.1300.0530.023-0.4100.474