単純コレスポンデンス分析の行と列の寄与度

単純コレスポンデンス分析の列寄与度および行寄与度によって得られるすべての統計量およびグラフの定義と解釈について解説します。

品質(Qual)

品質(Qual)は、選択した次元数における原点からの点の二乗距離を、最大次元数によって定義される空間における原点からの二乗距離で割ったものです。分割表にある行ごとや列ごとの品質の値が計算されます。

解釈

品質の値を使用して、成分によって表される列変動または行変動の比率を判断します。品質の値は常に0~1の範囲にあります。品質の値が大きいほど、行または列は成分によって十分に表現されます。本質の値が低いほど、表現は低下することを示します。行と列の品質の値により、成分は解釈しやすくなります。

行寄与度 成分1 成分2 ID 名前 品質 質量 変動 座標 相関 寄与 座標 相関 寄与 1 地質学 0.916 0.107 0.137 -0.076 0.055 0.016 -0.303 0.861 0.322 2 生物化学 0.881 0.036 0.119 -0.180 0.119 0.030 0.455 0.762 0.248 3 科学 0.644 0.163 0.021 -0.038 0.134 0.006 -0.073 0.510 0.029 4 動物学 0.929 0.151 0.230 0.327 0.846 0.413 -0.102 0.083 0.052 5 物理学 0.886 0.143 0.196 -0.316 0.880 0.365 -0.027 0.006 0.003 6 工学 0.870 0.111 0.152 0.117 0.121 0.039 0.292 0.749 0.310 7 微生物学 0.680 0.046 0.010 -0.013 0.009 0.000 0.110 0.671 0.018 8 植物学 0.654 0.108 0.067 0.179 0.625 0.088 0.039 0.029 0.005 9 統計学 0.561 0.036 0.012 -0.125 0.554 0.014 -0.014 0.007 0.000 10 数学 0.319 0.098 0.056 -0.107 0.240 0.029 0.061 0.079 0.012
列寄与度 成分1 成分2 ID 名前 品質 質量 変動 座標 相関 寄与 座標 相関 寄与 1 A 0.587 0.039 0.187 -0.478 0.574 0.228 -0.072 0.013 0.007 2 B 0.816 0.161 0.110 -0.127 0.286 0.067 -0.173 0.531 0.159 3 C 0.465 0.389 0.094 -0.083 0.341 0.068 -0.050 0.124 0.032 4 D 0.968 0.162 0.347 0.390 0.859 0.632 -0.139 0.109 0.103 5 E 0.990 0.249 0.262 0.032 0.012 0.006 0.292 0.978 0.699

行寄与度表では、品質の最大値は、動物学(0.929)と地質学(0.916)で発生しています。このため、これら2つの行は2つの成分で最もよく説明されます。最も説明できないフィールドは数学で、品質の値は0.319です。列寄与度表では、品質の値は資金カテゴリB(0.816)、D(0.968)、E(0.990)で最大です。このため、2つの成分は、資金カテゴリB、D、Eの期待値の偏差の大部分を説明します。

質量

質量は、分割表の行または列の相対度数の行列の合計です。行の質量は、行のすべての度数の和を分割表のすべての度数の和で割ったものです。列の質量は、列のすべての度数の和を分割表のすべての度数の和で割ったものです。

解釈

質量を使用して、行または列カテゴリごとの比率を決定します。質量の値が大きくなるほど、行または列の相対度数が高くなることを示します。すべての行カテゴリまたはすべての列カテゴリの合計質量は1(100%)に等しいです。

列寄与度表では、資金カテゴリCは最大の質量(0.389)を持ち、データの38.9%を占めます。資金カテゴリAは最小の質量(0.039)を持ち、データの3.9%を占めます。
行寄与度 成分1 成分2 ID 名前 品質 質量 変動 座標 相関 寄与 座標 相関 寄与 1 地質学 0.916 0.107 0.137 -0.076 0.055 0.016 -0.303 0.861 0.322 2 生物化学 0.881 0.036 0.119 -0.180 0.119 0.030 0.455 0.762 0.248 3 科学 0.644 0.163 0.021 -0.038 0.134 0.006 -0.073 0.510 0.029 4 動物学 0.929 0.151 0.230 0.327 0.846 0.413 -0.102 0.083 0.052 5 物理学 0.886 0.143 0.196 -0.316 0.880 0.365 -0.027 0.006 0.003 6 工学 0.870 0.111 0.152 0.117 0.121 0.039 0.292 0.749 0.310 7 微生物学 0.680 0.046 0.010 -0.013 0.009 0.000 0.110 0.671 0.018 8 植物学 0.654 0.108 0.067 0.179 0.625 0.088 0.039 0.029 0.005 9 統計学 0.561 0.036 0.012 -0.125 0.554 0.014 -0.014 0.007 0.000 10 数学 0.319 0.098 0.056 -0.107 0.240 0.029 0.061 0.079 0.012
列寄与度 成分1 成分2 ID 名前 品質 質量 変動 座標 相関 寄与 座標 相関 寄与 1 A 0.587 0.039 0.187 -0.478 0.574 0.228 -0.072 0.013 0.007 2 B 0.816 0.161 0.110 -0.127 0.286 0.067 -0.173 0.531 0.159 3 C 0.465 0.389 0.094 -0.083 0.341 0.068 -0.050 0.124 0.032 4 D 0.968 0.162 0.347 0.390 0.859 0.632 -0.139 0.109 0.103 5 E 0.990 0.249 0.262 0.032 0.012 0.006 0.292 0.978 0.699

行寄与度表では、質量は化学(0.163)と動物学(0.151)で最大になります。このため、これらの2つの行(フィールド)は0.163 + 0.151 = 0.314、つまりすべての行にあるデータの31.4%を占めます。生化学(0.036)と統計量(0.036)の質量は最小です。これらの各行は、データのおよそ3.6%しか占めません。

変動(Inert)

セル変動は、セル内のカイ二乗値を分割表の総度数で割ったものです。行変動(Inert)は行のセル変動の和です。列変動(Inert)は列のセル変動の和です。すべてのセル変動の和は全変動(または単に「変動」と呼びます)です。

解釈

行変動と列変動を使用して、カテゴリとデータの変動に対する寄与度の関係性を評価します。一般的には、値が高いほど、関係性が強く、期待値の偏差が大きくなることを示します。

行寄与度 成分1 成分2 ID 名前 品質 質量 変動 座標 相関 寄与 座標 相関 寄与 1 地質学 0.916 0.107 0.137 -0.076 0.055 0.016 -0.303 0.861 0.322 2 生物化学 0.881 0.036 0.119 -0.180 0.119 0.030 0.455 0.762 0.248 3 科学 0.644 0.163 0.021 -0.038 0.134 0.006 -0.073 0.510 0.029 4 動物学 0.929 0.151 0.230 0.327 0.846 0.413 -0.102 0.083 0.052 5 物理学 0.886 0.143 0.196 -0.316 0.880 0.365 -0.027 0.006 0.003 6 工学 0.870 0.111 0.152 0.117 0.121 0.039 0.292 0.749 0.310 7 微生物学 0.680 0.046 0.010 -0.013 0.009 0.000 0.110 0.671 0.018 8 植物学 0.654 0.108 0.067 0.179 0.625 0.088 0.039 0.029 0.005 9 統計学 0.561 0.036 0.012 -0.125 0.554 0.014 -0.014 0.007 0.000 10 数学 0.319 0.098 0.056 -0.107 0.240 0.029 0.061 0.079 0.012

行寄与度表では、変動(Inert)という列は、総変動に占める各行の寄与度です。つまり、「動物学」の全カイ二乗統計量への寄与度は13.7%です。動物学は変動の最大値(0.230)を持ちます。このため、動物学は全カイ二乗値に23%寄与し、列カテゴリ(資金)との関連性が他の行カテゴリよりも強いです。

座標(Coord)

Minitabでは、成分ごとの行と列の主座標(Coord)を計算します。主行座標は、主成分に関する行プロファイルごとの主座標です。主列座標は、主成分に関する列ごとのプロファイルの座標です。

行および列の主座標によって定義されるデータ点を視覚的に表示するには、対称プロットまたは非対称プロットを使用します。

相関(Corr)

Minitabでは、行と列の相関値を計算します。行の相関値は、各成分の行変動への寄与度を表しています。列の相関値は、各成分の列変動への寄与度を表しています。相関値は0~1の範囲になります。

解釈

相関値を使用して、変動の寄与度の観点で各成分を解釈します。1に近い値は、その成分が大きな変動量を占めることを示します。0に近い値は、その成分が変動にほとんど寄与しないことを示します。

行寄与度 成分1 成分2 ID 名前 品質 質量 変動 座標 相関 寄与 座標 相関 寄与 1 地質学 0.916 0.107 0.137 -0.076 0.055 0.016 -0.303 0.861 0.322 2 生物化学 0.881 0.036 0.119 -0.180 0.119 0.030 0.455 0.762 0.248 3 科学 0.644 0.163 0.021 -0.038 0.134 0.006 -0.073 0.510 0.029 4 動物学 0.929 0.151 0.230 0.327 0.846 0.413 -0.102 0.083 0.052 5 物理学 0.886 0.143 0.196 -0.316 0.880 0.365 -0.027 0.006 0.003 6 工学 0.870 0.111 0.152 0.117 0.121 0.039 0.292 0.749 0.310 7 微生物学 0.680 0.046 0.010 -0.013 0.009 0.000 0.110 0.671 0.018 8 植物学 0.654 0.108 0.067 0.179 0.625 0.088 0.039 0.029 0.005 9 統計学 0.561 0.036 0.012 -0.125 0.554 0.014 -0.014 0.007 0.000 10 数学 0.319 0.098 0.056 -0.107 0.240 0.029 0.061 0.079 0.012

これらの結果では、成分1は、動物学(Corr = 0.846)と物理学(Corr = 0.880)の変動の大部分を占めていますが、微生物学(Corr = 0.009)の変動をほとんど説明していません。

寄与度(Contr)

成分ごとの変動への各行または各列の寄与度(Contr)。

解釈

行および・または列が成分を解釈するための寄与度の値を使用します。

行寄与度 成分1 成分2 ID 名前 品質 質量 変動 座標 相関 寄与 座標 相関 寄与 1 地質学 0.916 0.107 0.137 -0.076 0.055 0.016 -0.303 0.861 0.322 2 生物化学 0.881 0.036 0.119 -0.180 0.119 0.030 0.455 0.762 0.248 3 科学 0.644 0.163 0.021 -0.038 0.134 0.006 -0.073 0.510 0.029 4 動物学 0.929 0.151 0.230 0.327 0.846 0.413 -0.102 0.083 0.052 5 物理学 0.886 0.143 0.196 -0.316 0.880 0.365 -0.027 0.006 0.003 6 工学 0.870 0.111 0.152 0.117 0.121 0.039 0.292 0.749 0.310 7 微生物学 0.680 0.046 0.010 -0.013 0.009 0.000 0.110 0.671 0.018 8 植物学 0.654 0.108 0.067 0.179 0.625 0.088 0.039 0.029 0.005 9 統計学 0.561 0.036 0.012 -0.125 0.554 0.014 -0.014 0.007 0.000 10 数学 0.319 0.098 0.056 -0.107 0.240 0.029 0.061 0.079 0.012

この行寄与度表では、動物学(0.413)と物理学(0.365)は成分1の変動に最も寄与します。地質学(0.322)、生化学(0.248)、工学(0.310)が成分2の変動に最も寄与します。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください