単純コレスポンデンス分析の行プロファイルと列プロファイル

単純コレスポンデンス分析の列プロファイルおよび行プロファイルによって得られるすべての統計量およびグラフの定義と解釈について解説します。

行プロファイル

行プロファイルは、分割表の度数から計算される行の比率を表示します。行プロファイルのセルごとの値は、セルの度数を行全体の度数の和で割ったものです。行ごとの行プロファイルを合計すると、およそ1(100%)になります。行の質量は、行のすべての度数の和を分割表のすべての度数の和で割ったものです。

解釈

行プロファイルを使用して、各行カテゴリの比率を列ごとに評価します。値を比較して、より大きな、またはより小さな度数の比率を占める行ごとのカテゴリを評価します。

行プロファイル

ABCDE質量
地質学0.0350.2240.4590.1650.1180.107
生物化学0.0340.0690.4480.0340.4140.036
化学0.0460.1920.3770.1620.2230.163
動物学0.0250.1250.3420.2920.2170.151
物理学0.0880.1930.4120.0790.2280.143
工学0.0340.1250.2840.1700.3860.111
微生物学0.0270.1620.3780.1350.2970.046
植物学0.0000.1400.3950.1980.2670.108
統計学0.0690.1720.3790.1380.2410.036
数学0.0260.1410.4740.1030.2560.098
質量0.0390.1610.3890.1620.249 

これらの行プロファイルは、各資金カテゴリ(A、B、C、D、E)に属する研究者の比率を学問分野ごとに示します。地質学の研究者のうち、資金カテゴリCが最大(45.9%)で、資金カテゴリAが最小(3.5%)です。地質学研究者の22.4%が資金カテゴリB、16.5%が資金カテゴリD、11.8%が資金カテゴリEに属します。地質学の行の質量は0.107であり、データセット内のすべての研究者の比率は、地質学の分野(10.7%)に属しています。

列プロファイル

列プロファイルは、分割表の度数から計算される列比率です。列プロファイル表の各セルの値は、セルの度数を、列全体に占める度数の合計で割ったものです。各列の合計は約1(100%)となる列プロファイル。列の質量は、列内のすべての度数の合計を、分割表のすべての度数の合計で割ったものです。

解釈

列プロファイルを使用して、列カテゴリごとの比率を行ごとに評価します。値を比較して、度数の割合が大きい、あるいは低い各列のカテゴリを評価します。

列プロファイル

ABCDE質量
地質学0.0970.1480.1260.1090.0510.107
生物化学0.0320.0160.0420.0080.0610.036
化学0.1940.1950.1580.1630.1460.163
動物学0.0970.1170.1320.2710.1310.151
物理学0.3230.1720.1520.0700.1310.143
工学0.0970.0860.0810.1160.1720.111
微生物学0.0320.0470.0450.0390.0560.046
植物学0.0000.0940.1100.1320.1160.108
統計学0.0650.0390.0350.0310.0350.036
数学0.0650.0860.1190.0620.1010.098
質量0.0390.1610.3890.1620.249 

これらの列プロファイルには、各資金カテゴリ(A、B、C、D、E)の学問分野ごとの研究者の比率が表示されます。資金カテゴリAの研究者のうち、物理学の比率が最も高く(32.3%)、植物学が最も低い(0%)。資金カテゴリAの質量0.039は、資金カテゴリAに分類されるデータセットのすべての研究者の比率(3.9%)です。