某银行需要贷款申请人提供八项信息:收入、教育程度、年龄、在目前住址的居住年限、在目前聘用单位的工作时间、储蓄、负债和信用卡数。银行管理员需要分析这些数据,以确定用于分组和报告这些数据的最佳方式。该管理员收集了 30 名贷款申请人的上述信息。

银行管理员使用 Pearson 相关来检查每对变量之间线性关系的强度和方向。
  1. 打开样本数据 贷款申请人.MTW.
  2. 选择统计 > 基本统计量 > 相关
  3. 变量中,输入 年龄 住址 服务处所 储蓄 外债 '信用卡数量'。
  4. 单击图形
  5. 要在图上显示的统计量中,选择相关和区间
  6. 单击每个对话框中的确定

解释结果

使用矩阵图可直观地评估每个项目或变量组合之间的关系。关系可以是线性或单调关系,也可以都不是。
  • 聘用年限与居住年限之间的 Pearson 相关系数最高。值 0.952 表明这两个变量之间存在正向关系。当聘用年限上升时,居住年限也上升。95% 置信区间为 0.901 − 0.977。
  • 信用卡和储蓄之间的 Pearson 相关系数为 –0.410。当信用卡数量上升时,储蓄往往下降。95% 置信区间的范围为 –0.671 到 –0.059。

还可以使用矩阵图查找可能会严重影响结果的异常值。例如,第 6 行包含可能会影响变量之间相关的极端数据点。在负债和年龄图中可以看到这样的示例。

通常,相关性越强,置信区间越窄。例如,信用卡数和年龄之间的相关较弱,95% 置信区间的范围是 -0.468 到 0.242。

Correlation: Age, Residence, Employ, Savings, Debt, Credit cards

Method Correlation type Pearson Rows used 30
Correlations Age Residence Employ Savings Debt Residence 0.838 Employ 0.848 0.952 Savings 0.552 0.570 0.539 Debt 0.032 0.186 0.247 -0.393 Credit cards -0.130 0.053 0.023 -0.410 0.474
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策