某银行需要贷款申请人提供八项信息:收入、教育程度、年龄、在目前住址的居住年限、在目前聘用单位的工作时间、储蓄、负债和信用卡数。银行管理员需要分析这些数据,以确定用于分组和报告这些数据的最佳方式。该管理员收集了 30 名贷款申请人的上述信息。

银行管理员使用 Pearson 相关来检查每对变量之间线性关系的强度和方向。

  1. 打开样本数据 贷款申请人.MTW.
  2. 选择统计 > 基本统计 > 相关
  3. 变量中,输入 年龄 住址 服务处所 储蓄 外债 '信用卡数量'。
  4. 单击图形
  5. 要在图上显示的统计量中,选择相关和区间
  6. 单击每个对话框中的确定

解释结果

使用矩阵图可直观地评估每个项目或变量组合之间的关系。关系可以是线性或单调关系,也可以都不是。
  • 聘用年限与居住年限之间的 Pearson 相关系数最高。值 0.952 表明这两个变量之间存在正向关系。当聘用年限上升时,居住年限也上升。95% 置信区间为 0.901 − 0.977。
  • 信用卡和储蓄之间的 Pearson 相关系数为 –0.410。当信用卡数量上升时,储蓄往往下降。95% 置信区间的范围为 –0.671 到 –0.059。

还可以使用矩阵图查找可能会严重影响结果的异常值。例如,第 6 行包含可能会影响变量之间相关的极端数据点。在负债和年龄图中可以看到这样的示例。

通常,相关性越强,置信区间越窄。例如,信用卡数和年龄之间的相关较弱,95% 置信区间的范围是 -0.468 到 0.242。

相关: 年龄, 住址, 服务处所, 储蓄, 外债, 信用卡数量

方法

相关类型Pearson
已使用的行数30

相关

年龄住址服务处所储蓄外债
住址0.838       
服务处所0.8480.952     
储蓄0.5520.5700.539   
外债0.0320.1860.247-0.393 
信用卡数量-0.1300.0530.023-0.4100.474