単純コレスポンデンス分析の例

大学の研究部長が、10の学問を、異なる5つの資金カテゴリについての比較方法を決めようとしています。部長は796人の研究員のための、2元分類データを集めます。

この2元分類で、学問は行、資金カテゴリは列です。Aは最も高い資金カテゴリ、Dは最も低い資金カテゴリ、Eは資金無しを表します。部長は、単純対応分析を実行し、行と列の関連を表しました。

管理者は、データ(主要セット)に追加データが含まれていないかどうかを調べたいと考えることもあります。追加データは、博物館研究者の追加行と、数学と統計学を合計した数理学の行が含まれます。

  1. サンプルデータを開く、研究資金.MTW#.
  2. 統計 > 多変量 > 単純コレスポンデンス分析を選択します。
  3. 入力データで、分割表の列を選択して、「CT1-CT5」と入力します。行名RowNamesを入力します。列名ColNamesを入力します。
  4. 結果をクリックして、行プロファイルを選択します。OKをクリックします。
  5. 追加データをクリックします。追加行に、RowSupp1RowSupp2を入力します。行名RSNamesを入力します。OKをクリックします。
  6. グラフをクリックします。全プロットの追加点を表示を選択します。行のみを示す同時プロット行と列を示す非対称行プロットを選択します。
  7. 各ダイアログボックスでOKをクリックします。

結果を解釈する

行プロファイル表には、各行カテゴリの比率が列ごとに表示されています。たとえば、地質学の場合、資金カテゴリAに属する研究者は全体の3.5%、資金カテゴリBに属する研究者は22.4%です。各行の質量は、データセット全体の研究者の比率を示しています。たとえば、地質学の質量は0.107であり、研究者の10.7%が地質学の分野に属しています。

行寄与度と列寄与度表の値を使用して、さまざまな成分を解釈できます。品質(Qual)という列は、2つの成分によって表される変動の比率を示します。

たとえば、行寄与度では、2つの成分の内訳によって、最もよく説明されるフィールドは動物学(0.929)と地質学(0.916)のフィールドです。最も説明できないフィールドは数学で、品質の値は0.319です。列寄与度では、2つの成分は、資金カテゴリB、D、Eのばらつきの大部分を説明します。資金のあるカテゴリA、B、C、Dが成分1にもっとも寄与していて、資金のないカテゴリEが成分2にもっとも寄与しています。

行のプロットは、主行座標を示します。「動物学」と「物理学」をもっともよく説明している成分1について見ると、これらの2つのフィールドが原点から一番離れているものの、記号は反対であることがわかります。したがって、成分1は、動物学および植物学などの生物学と物理学を対比します。成分2は生化学および工学と地質学を対比します。

非対称行プロットでは、行が主座標、列が標準座標になっています。資金クラスのうち、成分1は資金のレベルを対照し、成分2は資金があるか(AからD)ないか(E)を対照します。研究分野の中で、物理学が資金を一番多く受け、動物学が一番少なく受ける傾向にあります。生化学は、資金レベルは中間程度ですが、資金のない研究者に占める割合がもっとも高くなっています。博物館は資金を受けていますが、学術研究者よりもレベルが低いようです。

行プロファイル

ABCDE質量
地質学0.0350.2240.4590.1650.1180.107
生物化学0.0340.0690.4480.0340.4140.036
化学0.0460.1920.3770.1620.2230.163
動物学0.0250.1250.3420.2920.2170.151
物理学0.0880.1930.4120.0790.2280.143
工学0.0340.1250.2840.1700.3860.111
微生物学0.0270.1620.3780.1350.2970.046
植物学0.0000.1400.3950.1980.2670.108
統計学0.0690.1720.3790.1380.2410.036
数学0.0260.1410.4740.1030.2560.098
質量0.0390.1610.3890.1620.249 

分割表の分析

変動比率累積
10.03910.47200.4720
20.03040.36660.8385
30.01090.13110.9697
40.00250.03031.0000
合計0.0829   

行寄与度






成分1成分2
ID名前品質質量変動座標相関寄与座標相関寄与
1地質学0.9160.1070.137-0.0760.0550.016-0.3030.8610.322
2生物化学0.8810.0360.119-0.1800.1190.0300.4550.7620.248
3化学0.6440.1630.021-0.0380.1340.006-0.0730.5100.029
4動物学0.9290.1510.2300.3270.8460.413-0.1020.0830.052
5物理学0.8860.1430.196-0.3160.8800.365-0.0270.0060.003
6工学0.8700.1110.1520.1170.1210.0390.2920.7490.310
7微生物学0.6800.0460.010-0.0130.0090.0000.1100.6710.018
8植物学0.6540.1080.0670.1790.6250.0880.0390.0290.005
9統計学0.5610.0360.012-0.1250.5540.014-0.0140.0070.000
10数学0.3190.0980.056-0.1070.2400.0290.0610.0790.012

追加行






成分1成分2
ID名前品質質量変動座標相関寄与座標相関寄与
1博物館0.5560.0670.3530.3140.2250.168-0.3810.3310.318
2数学科学0.5590.1340.041-0.1120.4930.0430.0410.0660.007

列寄与度






成分1成分2
ID名前品質質量変動座標相関寄与座標相関寄与
1A0.5870.0390.187-0.4780.5740.228-0.0720.0130.007
2B0.8160.1610.110-0.1270.2860.067-0.1730.5310.159
3C0.4650.3890.094-0.0830.3410.068-0.0500.1240.032
4D0.9680.1620.3470.3900.8590.632-0.1390.1090.103
5E0.9900.2490.2620.0320.0120.0060.2920.9780.699