単純コレスポンデンス分析の例

大学の研究部長が、10の学問を、異なる5つの資金カテゴリについての比較方法を決めようとしています。部長は796人の研究員のための、2元分類データを集めます。

この2元分類で、学問は行、資金カテゴリは列です。Aは最も高い資金カテゴリ、Dは最も低い資金カテゴリ、Eは資金無しを表します。部長は、単純対応分析を実行し、行と列の関連を表しました。

管理者は、データ(主要セット)に追加データが含まれていないかどうかを調べたいと考えることもあります。追加データは、博物館研究者の追加行と、数学と統計学を合計した数理学の行が含まれます。

  1. サンプルデータを開く、研究資金.MTW.
  2. 統計 > 多変量解析 > 単純コレスポンデンス分析を選択します。
  3. 入力データで、分割表の列を選択して、「CT1-CT5」と入力します。行名RowNamesを入力します。列名ColNamesを入力します。
  4. 結果をクリックして、行プロファイルを選択します。OKをクリックします。
  5. 追加データをクリックします。追加行に、RowSupp1 RowSupp2を入力します。行名RSNamesを入力します。OKをクリックします。
  6. グラフをクリックします。全プロットの追加点を表示を選択します。行のみを示す同時プロット行と列を示す非対称行プロットを選択します。
  7. 各ダイアログボックスでOKをクリックします。

結果を解釈する

行プロファイル表には、各行カテゴリの比率が列ごとに表示されています。たとえば、地質学の場合、資金カテゴリAに属する研究者は全体の3.5%、資金カテゴリBに属する研究者は22.4%です。各行の質量は、データセット全体の研究者の比率を示しています。たとえば、地質学の質量は0.107であり、研究者の10.7%が地質学の分野に属しています。

行寄与度と列寄与度表の値を使用して、さまざまな成分を解釈できます。品質(Qual)という列は、2つの成分によって表される変動の比率を示します。

たとえば、行寄与度では、2つの成分の内訳によって、最もよく説明されるフィールドは動物学(0.929)と地質学(0.916)のフィールドです。最も説明できないフィールドは数学で、品質の値は0.319です。列寄与度では、2つの成分は、資金カテゴリB、D、Eのばらつきの大部分を説明します。資金のあるカテゴリA、B、C、Dが成分1にもっとも寄与していて、資金のないカテゴリEが成分2にもっとも寄与しています。

行のプロットは、主行座標を示します。「動物学」と「物理学」をもっともよく説明している成分1について見ると、これらの2つのフィールドが原点から一番離れているものの、記号は反対であることがわかります。したがって、成分1は、動物学および植物学などの生物学と物理学を対比します。成分2は生化学および工学と地質学を対比します。

非対称行プロットでは、行が主座標、列が標準座標になっています。資金クラスのうち、成分1は資金のレベルを対照し、成分2は資金があるか(AからD)ないか(E)を対照します。研究分野の中で、物理学が資金を一番多く受け、動物学が一番少なく受ける傾向にあります。生化学は、資金レベルは中間程度ですが、資金のない研究者に占める割合がもっとも高くなっています。博物館は資金を受けていますが、学術研究者よりもレベルが低いようです。

単純コレスポンデンス分析: CT1, CT2, CT3, CT4, CT5

行プロファイル A B C D E 質量 地質学 0.035 0.224 0.459 0.165 0.118 0.107 生物化学 0.034 0.069 0.448 0.034 0.414 0.036 科学 0.046 0.192 0.377 0.162 0.223 0.163 動物学 0.025 0.125 0.342 0.292 0.217 0.151 物理学 0.088 0.193 0.412 0.079 0.228 0.143 工学 0.034 0.125 0.284 0.170 0.386 0.111 微生物学 0.027 0.162 0.378 0.135 0.297 0.046 植物学 0.000 0.140 0.395 0.198 0.267 0.108 統計学 0.069 0.172 0.379 0.138 0.241 0.036 数学 0.026 0.141 0.474 0.103 0.256 0.098 質量 0.039 0.161 0.389 0.162 0.249
分割表の分析 軸 変動 比率 累積 1 0.0391 0.4720 0.4720 2 0.0304 0.3666 0.8385 3 0.0109 0.1311 0.9697 4 0.0025 0.0303 1.0000 合計 0.0829
行寄与度 成分1 成分2 ID 名前 品質 質量 変動 座標 相関 寄与 座標 相関 寄与 1 地質学 0.916 0.107 0.137 -0.076 0.055 0.016 -0.303 0.861 0.322 2 生物化学 0.881 0.036 0.119 -0.180 0.119 0.030 0.455 0.762 0.248 3 科学 0.644 0.163 0.021 -0.038 0.134 0.006 -0.073 0.510 0.029 4 動物学 0.929 0.151 0.230 0.327 0.846 0.413 -0.102 0.083 0.052 5 物理学 0.886 0.143 0.196 -0.316 0.880 0.365 -0.027 0.006 0.003 6 工学 0.870 0.111 0.152 0.117 0.121 0.039 0.292 0.749 0.310 7 微生物学 0.680 0.046 0.010 -0.013 0.009 0.000 0.110 0.671 0.018 8 植物学 0.654 0.108 0.067 0.179 0.625 0.088 0.039 0.029 0.005 9 統計学 0.561 0.036 0.012 -0.125 0.554 0.014 -0.014 0.007 0.000 10 数学 0.319 0.098 0.056 -0.107 0.240 0.029 0.061 0.079 0.012
追加行 成分1 成分2 ID 名前 品質 質量 変動 座標 相関 寄与 座標 相関 寄与 1 博物館 0.556 0.067 0.353 0.314 0.225 0.168 -0.381 0.331 0.318 2 数学科学 0.559 0.134 0.041 -0.112 0.493 0.043 0.041 0.066 0.007
列寄与度 成分1 成分2 ID 名前 品質 質量 変動 座標 相関 寄与 座標 相関 寄与 1 A 0.587 0.039 0.187 -0.478 0.574 0.228 -0.072 0.013 0.007 2 B 0.816 0.161 0.110 -0.127 0.286 0.067 -0.173 0.531 0.159 3 C 0.465 0.389 0.094 -0.083 0.341 0.068 -0.050 0.124 0.032 4 D 0.968 0.162 0.347 0.390 0.859 0.632 -0.139 0.109 0.103 5 E 0.990 0.249 0.262 0.032 0.012 0.006 0.292 0.978 0.699

行プロット

非対称行プロット

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください