ある銀行では、ローン申請者を、収入、学歴、年齢、現住所での居住年数、現職での勤続年数、貯蓄、負債、およびクレジットカード数の8項目で審査します。担当責任者は、このデータをグループ化して報告する最良の方法を決定するためにデータを分析しようとしています。そこで、30人のローン申請者についてこの情報を収集しました。
管理者は主成分分析を実行して、データ分析を簡単にするために変数の数を減らします。管理者は、データ分散の90%を説明するのに十分な成分を必要とします。
第1主成分の分散は、分散全体の44.3%を占めます。最初の主成分(PC1)と最も相関が高い変数は、年齢(0.484)、居住年数(0.466)、勤続年数(0.459)、貯蓄(0.404)です。最初の主成分は、これらの4つの変数すべてと正の相関があります。したがって、年齢、居住年数、勤続年数、貯蓄の値が上昇すると、最初の主成分の値も上昇します。最初の4つの主成分は、データ分散の90.7%を説明します。このため、管理者は、ローン申請者を分析するために、これらの成分を使用することを決めます。
固有値 | 3.5476 | 2.1320 | 1.0447 | 0.5315 | 0.4112 | 0.1665 | 0.1254 | 0.0411 |
---|---|---|---|---|---|---|---|---|
比率 | 0.443 | 0.266 | 0.131 | 0.066 | 0.051 | 0.021 | 0.016 | 0.005 |
累積 | 0.443 | 0.710 | 0.841 | 0.907 | 0.958 | 0.979 | 0.995 | 1.000 |
変数 | PC1 | PC2 | PC3 | PC4 | PC5 | PC6 | PC7 | PC8 |
---|---|---|---|---|---|---|---|---|
収入 | 0.314 | 0.145 | -0.676 | -0.347 | -0.241 | 0.494 | 0.018 | -0.030 |
学歴 | 0.237 | 0.444 | -0.401 | 0.240 | 0.622 | -0.357 | 0.103 | 0.057 |
年齢 | 0.484 | -0.135 | -0.004 | -0.212 | -0.175 | -0.487 | -0.657 | -0.052 |
居住年数 | 0.466 | -0.277 | 0.091 | 0.116 | -0.035 | -0.085 | 0.487 | -0.662 |
勤続年数 | 0.459 | -0.304 | 0.122 | -0.017 | -0.014 | -0.023 | 0.368 | 0.739 |
貯蓄 | 0.404 | 0.219 | 0.366 | 0.436 | 0.143 | 0.568 | -0.348 | -0.017 |
借金 | -0.067 | -0.585 | -0.078 | -0.281 | 0.681 | 0.245 | -0.196 | -0.075 |
クレジットカード数 | -0.123 | -0.452 | -0.468 | 0.703 | -0.195 | -0.022 | -0.158 | 0.058 |