某银行需要贷款申请人提供八项信息:收入、教育程度、年龄、在目前住址的居住年限、在目前聘用单位的工作时间、储蓄、负债和信用卡数。银行管理员需要分析这些数据,以确定用于分组和报告这些数据的最佳方式。该管理员收集了 30 名贷款申请人的上述信息。
银行管理员使用 Pearson 相关来检查每对变量之间线性关系的强度和方向。
- 打开样本数据 贷款申请人.MTW.
- 选择。
- 在变量中,输入 年龄 住址 服务处所 储蓄 外债 '信用卡数量'。
- 单击图形。
- 在要在图上显示的统计量中,选择相关和区间。
- 单击每个对话框中的确定。
解释结果
使用矩阵图可直观地评估每个项目或变量组合之间的关系。关系可以是线性或单调关系,也可以都不是。
- 聘用年限与居住年限之间的 Pearson 相关系数最高。值 0.952 表明这两个变量之间存在正向关系。当聘用年限上升时,居住年限也上升。95% 置信区间为 0.901 − 0.977。
- 信用卡和储蓄之间的 Pearson 相关系数为 –0.410。当信用卡数量上升时,储蓄往往下降。95% 置信区间的范围为 –0.671 到 –0.059。
还可以使用矩阵图查找可能会严重影响结果的异常值。例如,第 6 行包含可能会影响变量之间相关的极端数据点。在负债和年龄图中可以看到这样的示例。
通常,相关性越强,置信区间越窄。例如,信用卡数和年龄之间的相关较弱,95% 置信区间的范围是 -0.468 到 0.242。

Correlation: Age, Residence, Employ, Savings, Debt, Credit cards
Method
Correlation type Pearson
Rows used 30
Correlations
Age Residence Employ Savings Debt
Residence 0.838
Employ 0.848 0.952
Savings 0.552 0.570 0.539
Debt 0.032 0.186 0.247 -0.393
Credit cards -0.130 0.053 0.023 -0.410 0.474