ある銀行では、ローン申請者を、収入、学歴、年齢、現住所での居住年数、現職での勤続年数、貯蓄、負債、およびクレジットカード数の8項目で審査します。担当責任者は、このデータをグループ化して報告する最良の方法を決定するためにデータを分析しようとしています。そこで、30人のローン申請者についてこの情報を収集しました。

管理者は主成分分析を実行して、データ分析を簡単にするために変数の数を減らします。管理者は、データ分散の90%を説明するのに十分な成分を必要とします。

  1. サンプルデータを開く、ローン申請者.MTW.
  2. 統計 > 多変量解析 > 主成分分析を選択します。
  3. 変数に、「C1-C8」を入力します。
  4. OKをクリックします。

結果を解釈する

第1主成分の分散は、分散全体の44.3%を占めます。最初の主成分(PC1)と最も相関が高い変数は、年齢(0.484)、居住年数(0.466)、勤続年数(0.459)、貯蓄(0.404)です。最初の主成分は、これらの4つの変数すべてと正の相関があります。したがって、年齢、居住年数、勤続年数、貯蓄の値が上昇すると、最初の主成分の値も上昇します。最初の4つの主成分は、データ分散の90.7%を説明します。このため、管理者は、ローン申請者を分析するために、これらの成分を使用することを決めます。

主成分分析: 収入, 学歴, 年齢, 居住年数, 勤続年数, 貯蓄, 借金, ...

相関行列の固有分析 固有値 3.5476 2.1320 1.0447 0.5315 0.4112 0.1665 0.1254 0.0411 比率 0.443 0.266 0.131 0.066 0.051 0.021 0.016 0.005 累積 0.443 0.710 0.841 0.907 0.958 0.979 0.995 1.000
固有ベクトル 変数 PC1 PC2 PC3 PC4 PC5 PC6 PC7 収入 0.314 0.145 -0.676 -0.347 -0.241 0.494 0.018 学歴 0.237 0.444 -0.401 0.240 0.622 -0.357 0.103 年齢 0.484 -0.135 -0.004 -0.212 -0.175 -0.487 -0.657 居住年数 0.466 -0.277 0.091 0.116 -0.035 -0.085 0.487 勤続年数 0.459 -0.304 0.122 -0.017 -0.014 -0.023 0.368 貯蓄 0.404 0.219 0.366 0.436 0.143 0.568 -0.348 借金 -0.067 -0.585 -0.078 -0.281 0.681 0.245 -0.196 クレジットカード数 -0.123 -0.452 -0.468 0.703 -0.195 -0.022 -0.158 変数 PC8 収入 -0.030 学歴 0.057 年齢 -0.052 居住年数 -0.662 勤続年数 0.739 貯蓄 -0.017 借金 -0.075 クレジットカード数 0.058
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください