単純コレスポンデンス分析の主要な結果を解釈する

単純コレスポンデンス分析を解釈するには、次の手順を実行します。主要な結果には、主成分、変動、変動比率、品質、質量、グラフ数点が含まれます。

ステップ1:分数を判断する

変動の比率を使用して、データの期待値からの逸脱度の大部分を占める主成分(主軸とも呼ばれる)の最小の数を判断します。全変動の許容可能な割合を説明する主成分を保持します。許容可能な水準は用途によって変わります。第1成分、第2成分、または第3成分が全変動の大部分を占めるのが理想的です。

必要な主成分の最小値が、分析に入力する成分数と一致しない場合、適切な成分数を使用して分析を繰り返します。

分割表の分析

変動比率累積
10.03910.47200.4720
20.03040.36660.8385
30.01090.13110.9697
40.00250.03031.0000
合計0.0829   
主要な結果:軸、比率、累積

これらの結果は、10 x 5分割表の全変動を4つの成分(軸)に分解することを示します。4成分で説明される全変動は0.0829です。全変動の中でも、第1成分は変動の47.2%(比率 = 0.4720)を占め、第2成分は変動の36.66%(比率 = 0.3666)を占めます。これらの2成分で、全変動の83.85%(累積 = 0.8385)を占めます。このため、2つの成分を分析に指定すれば十分かもしれません。

ステップ2:主成分を解釈する

品質の値を使用して、成分によって表される列変動または行変動の比率を判断します。品質の値は常に0~1の範囲にあります。品質の値が大きいほど、行または列は成分によって十分に表現されることを示します。品質の値が低いほど、表現は低下します。行と列の品質の値により、成分は解釈しやすくなります。

行および・または列の寄与度の値を使用して、成分ごとの変動に最も寄与する列と行のカテゴリを評価します。成分を視覚的に解釈するには、行プロットまたは列プロットを使用します。

行寄与度






成分1成分2
ID名前品質質量変動座標相関寄与座標相関寄与
1地質学0.9160.1070.137-0.0760.0550.016-0.3030.8610.322
2生物化学0.8810.0360.119-0.1800.1190.0300.4550.7620.248
3化学0.6440.1630.021-0.0380.1340.006-0.0730.5100.029
4動物学0.9290.1510.2300.3270.8460.413-0.1020.0830.052
5物理学0.8860.1430.196-0.3160.8800.365-0.0270.0060.003
6工学0.8700.1110.1520.1170.1210.0390.2920.7490.310
7微生物学0.6800.0460.010-0.0130.0090.0000.1100.6710.018
8植物学0.6540.1080.0670.1790.6250.0880.0390.0290.005
9統計学0.5610.0360.012-0.1250.5540.014-0.0140.0070.000
10数学0.3190.0980.056-0.1070.2400.0290.0610.0790.012
主要な結果:品質、寄与度、列・列プロット

この分析では、2つの主成分を計算します。行寄与度表では、品質の最大値は、動物学(0.929)と地質学(0.916)で発生します。このため、これら2つの行は2つの成分で最もよく表現されます。最も説明できないフィールドは数学で、品質の値は0.319です。

動物学(0.413)と物理学(0.365)は成分1の変動に最も寄与します。地質学(0.322)、工学(0.310)、生化学(0.248)が成分2の変動に最も寄与します。

行プロットは主行座標を示します。動物学と物理学を最もよく説明している成分1について見ると、これらの2つのフィールドが原点から一番離れているものの、記号は反対であることがわかります。このため、成分1は動物学および植物学などの生物学と物理学を対比します。成分2は生化学および工学と地質学を対比します。

ステップ3:カテゴリ間の関係を調べる

行カテゴリと列カテゴリの計算された変動値を調べて、起こりうる関係を調べます。関係性が強いカテゴリほど変動値が高く、合計カイ二乗値に最も寄与することを示します。

非対称な行または列プロットを使用して、起こりうる関係性を視覚的に調べることができます。行プロットでは、行プロファイルと列頂点が近いほど、行プロファイルと列カテゴリの相関性が高くなります。列プロットでは、列プロファイルと行頂点が近いほど、列プロファイルと行カテゴリの相関性が高くなります。

行寄与度






成分1成分2
ID名前品質質量変動座標相関寄与座標相関寄与
1地質学0.9160.1070.137-0.0760.0550.016-0.3030.8610.322
2生物化学0.8810.0360.119-0.1800.1190.0300.4550.7620.248
3化学0.6440.1630.021-0.0380.1340.006-0.0730.5100.029
4動物学0.9290.1510.2300.3270.8460.413-0.1020.0830.052
5物理学0.8860.1430.196-0.3160.8800.365-0.0270.0060.003
6工学0.8700.1110.1520.1170.1210.0390.2920.7490.310
7微生物学0.6800.0460.010-0.0130.0090.0000.1100.6710.018
8植物学0.6540.1080.0670.1790.6250.0880.0390.0290.005
9統計学0.5610.0360.012-0.1250.5540.014-0.0140.0070.000
10数学0.3190.0980.056-0.1070.2400.0290.0610.0790.012
主要な結果:変動、非対称行/列プロット

行寄与度表では、Inert(変動)という列は、各行が寄与する全変動の比率です。つまり、地質学の全カイ二乗統計量への寄与度は13.7%です。動物学は変動の最大値(0.230)を持ちます。このため、動物学はカイ二乗値の合計に23%寄与し、列カテゴリ(資金)との関係性が他の行カテゴリよりも強いです。

非対称行プロットでは、行の点は学問分野を表し、列の点は資金水準(Aは最大の資金水準、Dは最小の資金水準、Eは資金なし)を表します。生化学は列カテゴリEに最も近く、学問分野としての生化学が、この研究では資金調達が難しい研究者の割合が最も高いことを示しています。