因子分析のすべての統計量およびグラフを解釈する

因子分析によって得られるすべての統計量およびグラフの定義と解釈について解説します。

因子負荷量

因子負荷量は、因子が変数をどの程度説明するかを示します。負荷量の範囲は-1~1です。

分析の回転方法を選択した場合、無回転因子の負荷量と回転因子の負荷量が計算されます。

解釈

負荷量パターンを調べ、各変数に対する影響が最も大きい因子を判断します。-1または1に近い負荷量は、因子が変数に強く影響していることを示します。ゼロに近い負荷量は、変数に対する因子の影響が弱いことを示します。変数によっては、複数の因子に高い負荷を与える場合もあります。

無回転の因子負荷量は解釈しにくいです。因子回転によって負荷量構造を単純化すると、より明確に、より簡単に因子負荷量を解釈できるようになることが多いです。ただし、1つの回転方法があらゆる場合に最適であるとは限りません。さまざまな回転を試し、最も解釈しやすい結果が得られる回転を使用してください。回転負荷量を並べ替えて、因子内の負荷量をより明確に評価することもできます。

次のような無回転の因子負荷量表では、因子1の負荷量の大半は、因子を解釈しにくくする値に近いです。他の因子の無回転負荷量も解釈しにくいです。データに対してバリマックス回転が実行されると、回転因子負荷量が計算されます。より簡単に因子を解釈できるようになっています。
  • 会社への適合性(0.778)、仕事への適合性(0.844)、可能性(0.645)には、因子1に大きな正の負荷量があるので、この因子は、この会社における従業員適合性と成長可能性を説明します。
  • 容姿(0.730)、好感度(0.615)、および自信(0.743)は、因子2に大きな正の負荷量を持つため、この因子は個人資質を説明します。
  • コミュニケーション能力(0.802)と協調性(0.889)は、因子3に大きな正の負荷量を持つため、この因子は作業スキルを説明します。
  • 関心表明書(0.947)と履歴書(0.789)は、因子4に大きな正の負荷量を持つため、この因子は文章力を説明します。

無回転の因子負荷量と共通性

変数因子1因子2因子3因子4共通性
学歴0.3800.4550.3400.2590.534
容姿0.3590.530-0.0400.5230.685
コミュニケーション能力0.4650.660-0.377-0.0230.795
会社への適合性0.5230.6770.266-0.2530.866
経歴0.5080.1940.4500.2320.553
仕事への適合性0.5320.6320.415-0.2010.895
関心表明書0.992-0.094-0.012-0.0070.994
好感度0.4120.5290.0320.3770.593
協調性0.4060.761-0.424-0.0550.926
将来性0.4460.5480.4310.1720.714
履歴書0.8500.0400.0960.2830.814
自信0.2930.5750.0830.5060.679
           
分散3.63203.31931.08831.00959.0491
% 分散0.3030.2770.0910.0840.754

回転した因子負荷量と共通性

バリマックス回転
変数因子1因子2因子3因子4共通性
学歴0.4810.5100.0860.1880.534
容姿0.1400.7300.3190.1750.685
コミュニケーション能力0.2030.2800.8020.1810.795
会社への適合性0.7780.1650.4450.1890.866
経歴0.4720.395-0.1120.4010.553
仕事への適合性0.8440.2090.3050.2150.895
関心表明書0.2190.0520.2170.9470.994
好感度0.2610.6150.3210.2080.593
協調性0.2170.2850.8890.0860.926
将来性0.6450.4920.1210.2020.714
履歴書0.2140.3650.1130.7890.814
自信0.2390.7430.2490.0920.679
           
分散2.51532.48802.08631.95949.0491
% 分散0.2100.2070.1740.1630.754

共通性

共通性は、因子によって説明される各変数のばらつきの比率です。共通性の値は、分析の無回転因子負荷量を使用しても、回転因子負荷量を使用しても変わりません。

解釈

共通性の値を調べて、各変数が因子によってどの程度説明できるかを評価します。共通性が1に近いほど、変数は因子によって良好に説明されます。特定の変数の適合に著しく寄与する因子があれば、それを追加できます。

無回転の因子負荷量と共通性

変数因子1因子2因子3因子4共通性
学歴0.3800.4550.3400.2590.534
容姿0.3590.530-0.0400.5230.685
コミュニケーション能力0.4650.660-0.377-0.0230.795
会社への適合性0.5230.6770.266-0.2530.866
経歴0.5080.1940.4500.2320.553
仕事への適合性0.5320.6320.415-0.2010.895
関心表明書0.992-0.094-0.012-0.0070.994
好感度0.4120.5290.0320.3770.593
協調性0.4060.761-0.424-0.0550.926
将来性0.4460.5480.4310.1720.714
履歴書0.8500.0400.0960.2830.814
自信0.2930.5750.0830.5060.679
           
分散3.63203.31931.08831.00959.0491
% 分散0.3030.2770.0910.0840.754

これらの結果では、4因子は12の変数から抽出されます。4因子の共通性の値は、一般的にすべての変数で高く、変数は4因子で十分に表現できることを示しています。たとえば、仕事への適合性の変動率0.895(89.5%)は、4因子によって説明されます。

分散

各因子によって説明されるデータのばらつきです。主成分抽出法を使用し、負荷量を回転しない場合、各因子の分散はその固有値と等しくなります。回転は、すべての因子で説明される全体の分散を変化させずに、因子ごとに説明される分散比率の分布を変化させます。

解釈

因子ごとの分散を調べます。分散が高いほど、因子が説明するデータのばらつきが大きくなります。分析で抽出する因子数が分からない場合、まず主成分抽出法を用い、回転させずに、デフォルトの因子数(因子の最大数を抽出)を予備評価として使用できます。その後、重要な因子を、特定の値よりも大きな分散(固有値)を持つ因子として定義します。たとえば、固有値に最低でも1を持つ因子を含めることが1つの基準です。別な方法は、固有値がほとんど変化を示さず、0に近づく点を判断するために、固有値(Scree)プロットの固有値を視覚的に評価する方法です。詳細は固有値プロットのトピックを参照してください。

無回転の因子負荷量と共通性

変数因子1因子2因子3因子4因子5因子6因子7因子8因子9因子10
学歴0.7260.336-0.3260.104-0.354-0.0990.2330.1470.097-0.142
容姿0.719-0.271-0.163-0.400-0.148-0.362-0.195-0.1510.0820.016
コミュニケーション能力0.712-0.4460.2550.229-0.3190.1190.0320.0880.0230.204
会社への適合性0.802-0.0600.0480.4280.306-0.137-0.0670.105-0.019-0.067
経歴0.6440.605-0.182-0.037-0.0920.317-0.209-0.1020.1210.039
仕事への適合性0.8130.078-0.0290.3650.368-0.067-0.025-0.0320.1460.066
関心表明書0.6250.3270.654-0.1340.0310.0250.017-0.113-0.079-0.130
好感度0.739-0.295-0.117-0.3460.2490.1400.353-0.1420.0510.022
協調性0.706-0.5400.1400.247-0.2170.136-0.080-0.105-0.020-0.162
将来性0.8140.290-0.3260.167-0.068-0.0730.048-0.112-0.2900.100
履歴書0.7090.2980.465-0.343-0.022-0.1070.0240.1700.0080.090
自信0.719-0.262-0.294-0.4090.1750.179-0.1590.230-0.098-0.061
                     
分散6.38761.48851.10451.05160.63250.36700.30160.21290.15570.1379
% 分散0.5320.1240.0920.0880.0530.0310.0250.0180.0130.011
変数因子11因子12共通性
学歴-0.026-0.0311.000
容姿0.020-0.0381.000
コミュニケーション能力0.012-0.1001.000
会社への適合性0.188-0.0211.000
経歴0.0770.0091.000
仕事への適合性-0.1760.0081.000
関心表明書-0.043-0.1271.000
好感度0.0640.0121.000
協調性-0.0320.1361.000
将来性-0.0230.0281.000
履歴書0.0100.1561.000
自信-0.065-0.0471.000
       
分散0.08510.075012.0000
% 分散0.0070.0061.000

この分析は、主成分法とデフォルト設定(無回転)を使用して実行します。最初の4つの因子の分散(固有値)は1よりも大きいです。7個以上の因子を使用する場合、固有値の変化は著しく少なくなります。このため、4因子はデータのばらつきの大部分を説明します。こうした予備の結果に基づいて、因子分析を繰り返して4因子のみを抽出し、さまざまな回転を試します。

分散%

分散(分散%)の割合は、因子ごとに説明されるデータのばらつきの比率です。分散%の値の範囲は0~1(0~100%)です。

解釈

因子ごとの分散%の値を調べます。分散%の値が高いほど、因子が説明するばらつきが大きくなることを示します。したがって、分散%の値を使用して、最も重要な因子を決定できます。

分散%の共通性の値は、分析のすべての因子によって全体の分散が説明されることを示します。分析に使用する因子数がデータ内の全体の分散の十分な量を説明するかどうかを判断しやするくするために、この値を使用します。

無回転の因子負荷量と共通性

変数因子1因子2因子3因子4共通性
学歴0.3800.4550.3400.2590.534
容姿0.3590.530-0.0400.5230.685
コミュニケーション能力0.4650.660-0.377-0.0230.795
会社への適合性0.5230.6770.266-0.2530.866
経歴0.5080.1940.4500.2320.553
仕事への適合性0.5320.6320.415-0.2010.895
関心表明書0.992-0.094-0.012-0.0070.994
好感度0.4120.5290.0320.3770.593
協調性0.4060.761-0.424-0.0550.926
将来性0.4460.5480.4310.1720.714
履歴書0.8500.0400.0960.2830.814
自信0.2930.5750.0830.5060.679
           
分散3.63203.31931.08831.00959.0491
% 分散0.3030.2770.0910.0840.754

これらの結果では、データのばらつきの0.303(30.3%)は因子1によって説明されます。4つの因子全体で、0.754(75.4%)、つまりデータ内のばらつきを説明します。

因子スコア係数

因子係数は、因子分析において、成分の各変数の相対的な重みを示します。係数の絶対値が大きくなるほど、成分を計算するうえで対応する変数が重要になります。Minitabは、因子の係数を使用して因子のスコア(因子の推定値でもある)を計算します。Minitabでは、平均値を減算することでデータをスケーリングして中央に集めた後、(因子1、因子2などの下に示される)因子スコア係数とデータを乗算して因子スコアを計算します。

解釈

因子スコアを使用して、次のことができます。
  • 観測値の傾向を調べます。
  • 回帰分析や多変量分散分析などの他の分析で使用します。

因子スコアの計算に推定された係数を使用するには、変数を標準化する必要があります。

固有値(Scree)プロット

screeプロットは、因子数とその対応する固有値との関係を表示します。固有値(Scree)プロットは固有値を最大値から最小値に並べます。回転を行わない場合、相関行列の固有値は因子の分散と等しくなります。

固有値プロットを表示するには、グラフをクリックして、分析を実行するときに固有値プロットを選択する必要があります。

解釈

固有値(Scree)プロットを使用して、固有値のサイズによって使用する因子の数を選択します。理想的なパターンは、勾配曲線の後に、曲がり、そして直線が続く形です。直線傾向が始まる最初の点より前の勾配曲線の中で、この因子を使用します。

この固有値(Scree)プロットでは、最初の4つの因子が、(固有値で決まる)データの全変動の大部分を占めています。最初の4つの因子の固有値はすべて、1より大きいです。残りの因子は、分散における割合が極めて小さく、重要ではない可能性が高いです。

スコアプロット

スコアプロットは、第1因子スコアと第2因子スコアとの関係をグラフにします。

スコアプロットを表示するには、グラフをクリックして、分析を実行するときにスコアプロットを選択する必要があります。

解釈

最初の2つの成分が、データのほとんどの分散を説明する場合は、スコアプロットを使用してデータ構造を評価し、クラスター、外れ値、および傾向を検出できます。プロット上のデータをグループ化する場合、データ内に2つ以上の異なる分布があることを示します。データが正規分布に従い、外れ値が存在しなければ、点はゼロの値付近にランダムに分布します。

このスコアプロットでは、データは正常で、極端な外れ値はないことがわかります。ただし、他のデータ値から離れているプロットの右下に示されるデータ値を精査したくなると思います。

ヒント

観測値ごとに計算されたスコアを確認するには、ポインタをグラフのデータ点の上に置きます。 他の因子のスコアプロットを作成するには、スコアを保存し、グラフ > 散布図を使用します。

負荷量プロット

負荷量プロットは、最初の因子の変数ごとの回転因子負荷量対二番目の因子の回転因子負荷量をグラフ化します。

負荷量プロットを表示するには、グラフをクリックして、分析を実行するときに負荷量プロットを選択する必要があります。

解釈

負荷量プロットを使用して、どの変数が因子に最大の効果があるかを特定します。負荷量は-1~1の範囲です。-1または1に近い負荷量は、変数に対する因子の影響が強いことを示します。ゼロに近い負荷量は、変数に対する因子の影響が弱いことを示します。負荷量の評価により、変数の観点から、各因子を特徴づけやすくすることもできます。因子数を選択したら、因子負荷量を解釈しやすいように別の回転を行います。

こうした負荷量プロットでは、バリマックス回転はデータ上で実行され、最初の2つの因子は解釈しやすくなります。仕事への適合性と会社への適合性には、因子1に大きな正の負荷量があるので、この因子は、申請者の地位に対する適合性を説明します。容姿、好感度、および自信は、因子2で大きな正の負荷量を持つため、この因子は申請者の「個人資質」を説明します。

バイプロット

バイプロットではスコアプロットと負荷量プロットが重ね合わて表示されます。

バイプロットを表示するには、グラフをクリックして、分析を実行するときにバイプロットを選択する必要があります。

解釈

1つのグラフにある最初の2つの因子のデータ構造と負荷量を評価するには、バイプロットを使用します。Minitabでは、第2因子スコアと第1因子スコアだけでなく、両方の因子の負荷量をプロットします。

バイプロットは次のことを示しています。
  • データは正常で、極端な外れ値はないことがわかります。ただし、他のデータ値から離れているプロットの右下に示されるデータ値を精査したくなると思います。
  • 会社への適合性と仕事への適合性には、因子1に大きな正の負荷量があるので、この因子は、申請者の地位に対する適正を説明します。
  • 容姿、好感度、および自信は、因子2に大きな正の負荷量があるので、この因子は、申請者の個人資質を説明します。