某银行需要贷款申请人提供八项信息:收入、教育程度、年龄、在目前住址的居住年限、在目前聘用单位的工作时间、储蓄、负债和信用卡数。银行管理员需要分析这些数据,以确定用于分组和报告这些数据的最佳方式。该管理员收集了 30 名贷款申请人的上述信息。
银行管理员使用 Pearson 相关来检查每对变量之间线性关系的强度和方向。
还可以使用矩阵图查找可能会严重影响结果的异常值。例如,第 6 行包含可能会影响变量之间相关的极端数据点。在负债和年龄图中可以看到这样的示例。
通常,相关性越强,置信区间越窄。例如,信用卡数和年龄之间的相关较弱,95% 置信区间的范围是 -0.468 到 0.242。
相关类型 | Pearson |
---|---|
已使用的行数 | 30 |
年龄 | 住址 | 服务处所 | 储蓄 | 外债 | |
---|---|---|---|---|---|
住址 | 0.838 | ||||
服务处所 | 0.848 | 0.952 | |||
储蓄 | 0.552 | 0.570 | 0.539 | ||
外债 | 0.032 | 0.186 | 0.247 | -0.393 | |
信用卡数量 | -0.130 | 0.053 | 0.023 | -0.410 | 0.474 |