主成分分析の例

ある銀行では、ローン申請者を、収入、学歴、年齢、現住所での居住年数、現職での勤続年数、貯蓄、負債、およびクレジットカード数の8項目で審査します。担当責任者は、このデータをグループ化して報告する最良の方法を決定するためにデータを分析しようとしています。そこで、30人のローン申請者についてこの情報を収集しました。

管理者は主成分分析を実行して、データ分析を簡単にするために変数の数を減らします。管理者は、データ分散の90%を説明するのに十分な成分を必要とします。

  1. サンプルデータを開く、ローン申請者.MTW.
  2. 統計 > 多変量 > 主成分を選択します。
  3. 変数に、「C1-C8」を入力します。
  4. OKをクリックします。

結果を解釈する

第1主成分の分散は、分散全体の44.3%を占めます。最初の主成分(PC1)と最も相関が高い変数は、年齢(0.484)、居住年数(0.466)、勤続年数(0.459)、貯蓄(0.404)です。最初の主成分は、これらの4つの変数すべてと正の相関があります。したがって、年齢、居住年数、勤続年数、貯蓄の値が上昇すると、最初の主成分の値も上昇します。最初の4つの主成分は、データ分散の90.7%を説明します。このため、管理者は、ローン申請者を分析するために、これらの成分を使用することを決めます。

相関行列の固有分析

固有値3.54762.13201.04470.53150.41120.16650.12540.0411
比率0.4430.2660.1310.0660.0510.0210.0160.005
累積0.4430.7100.8410.9070.9580.9790.9951.000

固有ベクトル

変数PC1PC2PC3PC4PC5PC6PC7PC8
収入0.3140.145-0.676-0.347-0.2410.4940.018-0.030
学歴0.2370.444-0.4010.2400.622-0.3570.1030.057
年齢0.484-0.135-0.004-0.212-0.175-0.487-0.657-0.052
居住年数0.466-0.2770.0910.116-0.035-0.0850.487-0.662
勤続年数0.459-0.3040.122-0.017-0.014-0.0230.3680.739
貯蓄0.4040.2190.3660.4360.1430.568-0.348-0.017
借金-0.067-0.585-0.078-0.2810.6810.245-0.196-0.075
クレジットカード数-0.123-0.452-0.4680.703-0.195-0.022-0.1580.058