単純コレスポンデンス分析の度数とカイ二乗距離

単純コレスポンデンス分析の度数とカイ二乗距離によって得られるすべての統計量およびグラフの定義と解釈について解説します。

分割表

分割表は、複数のカテゴリ変数に従って観測値を集計する表です。表の行と列は、カテゴリ変数に対応しています。この表には、変数の各水準の周辺合計も含まれます。

単純コレスポンデンス分析の分割表は、2つの変数の観測値を集計する2元表です。組み合わせるサブダイアログボックスを使用して、3つまたは4つの変数の観測値をカテゴリ化し、変数を交差させて2元表の行および・または列を作成することもできます。

解釈

分割表を使用して、行カテゴリと列カテゴリで定義されるセルごとの観測頻度を表示します。列と行の合計を使用して、カテゴリごとの合計頻度を確認します。

分割表 A B C D E 合計 地質学 3.000 19.000 39.000 14.000 10.000 85.000 生物化学 1.000 2.000 13.000 1.000 12.000 29.000 科学 6.000 25.000 49.000 21.000 29.000 130.000 動物学 3.000 15.000 41.000 35.000 26.000 120.000 物理学 10.000 22.000 47.000 9.000 26.000 114.000 工学 3.000 11.000 25.000 15.000 34.000 88.000 微生物学 1.000 6.000 14.000 5.000 11.000 37.000 植物学 0.000 12.000 34.000 17.000 23.000 86.000 統計学 2.000 5.000 11.000 4.000 7.000 29.000 数学 2.000 11.000 37.000 8.000 20.000 78.000 合計 31.000 128.000 310.000 129.000 198.000 796.000

次の2元分割表は、学問分野や資金カテゴリ(A、B、C、D、E)ごとの研究者の観測回数を示しています。「合計」列は、研究者の大半が、化学(130)、動物学(120)、物理学(114)の分野を専門としていることを示しています。「合計」行は、研究者の大半が、資金カテゴリC(310)に分類されることを示しています。セル度数では、資金カテゴリCに分類される化学の研究者の観測頻度が最大(49)となっています。

期待度数

観測度数は、変数が互いに独立している場合の、期待されるセル内の観測値の度数です。Minitabでは、期待度数を、行の合計と列の合計を掛け合わせて、観測値の合計数で割って計算します。

期待度数 A B C D E 地質学 3.310 13.668 33.103 13.775 21.143 生物化学 1.129 4.663 11.294 4.700 7.214 科学 5.063 20.905 50.628 21.068 32.337 動物学 4.673 19.296 46.734 19.447 29.849 物理学 4.440 18.332 44.397 18.475 28.357 工学 3.427 14.151 34.271 14.261 21.889 微生物学 1.441 5.950 14.410 5.996 9.204 植物学 3.349 13.829 33.492 13.937 21.392 統計学 1.129 4.663 11.294 4.700 7.214 数学 3.038 12.543 30.377 12.641 19.402

次の期待度数表は、資金と学問分野の関係が独立しているものとして、学問分野と資金カテゴリ(A、B、C、D、E)ごとの研究者の期待度数を示します。研究者の大半が化学に、大半の学部が資金カテゴリCに属しているので、これらのカテゴリの組み合わせの期待が最も高くなります(およそ51)。

観測度数ー期待度数

観測度数-期待度数は、変数が互いに独立している場合の、実際のセル内の観測値の度数と期待するセル内の観測値の度数の差です。

解釈

観測度数と期待度数の差を使用して、データ内の起こりうる関係の根拠があるかどうかを確認します。2つの変数が関連している場合、1つの変数に対する観測値の分布はもう1つの変数のカテゴリに応じて異なります。結果的に、観測度数と期待度数の差の大きさは相対的に大きくなります。2つの変数が独立している場合、1つの変数に対する観測値の分布はもう1つの変数の全カテゴリと類似します。結果的に、観測度数と期待度数の差の大きさは相対的に小さくなります。

観測度数-期待度数 A B C D E 地質学 -0.310 5.332 5.897 0.225 -11.143 生物化学 -0.129 -2.663 1.706 -3.700 4.786 科学 0.937 4.095 -1.628 -0.068 -3.337 動物学 -1.673 -4.296 -5.734 15.553 -3.849 物理学 5.560 3.668 2.603 -9.475 -2.357 工学 -0.427 -3.151 -9.271 0.739 12.111 微生物学 -0.441 0.050 -0.410 -0.996 1.796 植物学 -3.349 -1.829 0.508 3.063 1.608 統計学 0.871 0.337 -0.294 -0.700 -0.214 数学 -1.038 -1.543 6.623 -4.641 0.598

この表では、観測度数と期待度数の差の大きさは、動物学かつ資金カテゴリD(15.553)や工学かつ資金カテゴリE(12.111)の場合に相対的に大きくなります。これらのセルでは、観測度数は、変数が独立している場合に期待する度数よりも大きくなります。差の大きさは、地質学かつ資金カテゴリE(-11.143)の場合にも相対的に大きくなります。この度数では、観測度数は、変数が独立している場合に期待する度数よりも小さくなります。このため、工学部の資金調達難は期待よりもかなり大きく、地質学部の資金調達難は期待よりもかなり小さいと結論付けられます。

カイ二乗距離

Minitabでは、各セルのカイ二乗統計量への寄与度がカイ二乗距離として表示されます。各セルのカイ二乗距離は、各セルの相違に起因する合計カイ二乗統計量を定量化します。

Minitabでは、各セルのカイ二乗統計量への寄与度が、そのセルの期待値で割った、セルの観測値と期待値の間の差の平方として計算されます。カイ二乗合計は、すべてのセルの値の和です。

解釈

セルごとのカイ二乗距離を比較して、カイ二乗合計に最も寄与するセルを評価できます。観測セル度数と期待セル度数が大きく異なる場合、セルのカイ二乗値は大きくなります。このため、セル内のカイ二乗距離が大きくなるほど、行と列のカテゴリ間の関係性が期待されるよりも強くなることがあることを示します。

カイ二乗距離 A B C D E 合計 地質学 0.029 2.080 1.050 0.004 5.873 9.036 生物化学 0.015 1.521 0.258 2.913 3.176 7.882 科学 0.173 0.802 0.052 0.000 0.344 1.373 動物学 0.599 0.957 0.703 12.438 0.496 15.194 物理学 6.964 0.734 0.153 4.859 0.196 12.906 工学 0.053 0.702 2.508 0.038 6.700 10.001 微生物学 0.135 0.000 0.012 0.166 0.351 0.663 植物学 3.349 0.242 0.008 0.673 0.121 4.393 統計学 0.671 0.024 0.008 0.104 0.006 0.814 数学 0.354 0.190 1.444 1.704 0.018 3.710 合計 12.343 7.252 6.196 22.899 17.282 65.972

この表では、動物学と資金カテゴリDのセルが12.438であり、全体カイ二乗(65.972)への寄与度が最も大きいです。行カテゴリの中では、動物学(15.194)、物理学(12.906)、工学(10.001)が全体カイ二乗に最も寄与します。列カテゴリの中では、資金水準D(22.899)とE(17.282)が全体カイ二乗に最も寄与します。

相対的変動

セル変動は、セル内のカイ二乗値を分割表の総度数で割った値です。すべてのセル変動の和は、全変動(または単に「変動」)と呼びます。セルの相対的変動は、セル変動を全変動で割った数です。行の相対的変動は、行のセル変動の和を全変動で割った数です。列の相対的変動は、列のセル変動の和を全変動で割った数です。

解釈

相対的変動を使用して、カテゴリとデータ内の分散への寄与度の関係の強さを評価します。値が高いほど、一般的には、関係性は強くなり、データ内の期待値から得られるばらつき全体の比率が大きくなることを示します。

相対的変動 A B C D E 合計 地質学 0.000 0.032 0.016 0.000 0.089 0.137 生物化学 0.000 0.023 0.004 0.044 0.048 0.119 科学 0.003 0.012 0.001 0.000 0.005 0.021 動物学 0.009 0.015 0.011 0.189 0.008 0.230 物理学 0.106 0.011 0.002 0.074 0.003 0.196 工学 0.001 0.011 0.038 0.001 0.102 0.152 微生物学 0.002 0.000 0.000 0.003 0.005 0.010 植物学 0.051 0.004 0.000 0.010 0.002 0.067 統計学 0.010 0.000 0.000 0.002 0.000 0.012 数学 0.005 0.003 0.022 0.026 0.000 0.056 合計 0.187 0.110 0.094 0.347 0.262 1.000

相対的変動表は、カイ二乗統計量の合計に対する各セルの相対寄与度を示します。セル内の相対的変動が大きくなるほど、行と列のカテゴリ間の関係は強くなります。この表では、動物学と資金カテゴリDのセルの相対的変動が最大(0.189)になり、表の中で最も強い関連性となります。この表は、行ごと、列ごとの相対的変動の全体を示しています。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください