分割表は、複数のカテゴリ変数に従って観測値を集計する表です。表の行と列は、カテゴリ変数に対応しています。この表には、変数の各水準の周辺合計も含まれます。
単純コレスポンデンス分析の分割表は、2つの変数の観測値を集計する2元表です。組み合わせるサブダイアログボックスを使用して、3つまたは4つの変数の観測値をカテゴリ化し、変数を交差させて2元表の行および・または列を作成することもできます。
分割表を使用して、行カテゴリと列カテゴリで定義されるセルごとの観測頻度を表示します。列と行の合計を使用して、カテゴリごとの合計頻度を確認します。
A | B | C | D | E | 合計 | |
---|---|---|---|---|---|---|
地質学 | 3.000 | 19.000 | 39.000 | 14.000 | 10.000 | 85.000 |
生物化学 | 1.000 | 2.000 | 13.000 | 1.000 | 12.000 | 29.000 |
化学 | 6.000 | 25.000 | 49.000 | 21.000 | 29.000 | 130.000 |
動物学 | 3.000 | 15.000 | 41.000 | 35.000 | 26.000 | 120.000 |
物理学 | 10.000 | 22.000 | 47.000 | 9.000 | 26.000 | 114.000 |
工学 | 3.000 | 11.000 | 25.000 | 15.000 | 34.000 | 88.000 |
微生物学 | 1.000 | 6.000 | 14.000 | 5.000 | 11.000 | 37.000 |
植物学 | 0.000 | 12.000 | 34.000 | 17.000 | 23.000 | 86.000 |
統計学 | 2.000 | 5.000 | 11.000 | 4.000 | 7.000 | 29.000 |
数学 | 2.000 | 11.000 | 37.000 | 8.000 | 20.000 | 78.000 |
合計 | 31.000 | 128.000 | 310.000 | 129.000 | 198.000 | 796.000 |
次の2元分割表は、学問分野や資金カテゴリ(A、B、C、D、E)ごとの研究者の観測回数を示しています。「合計」列は、研究者の大半が、化学(130)、動物学(120)、物理学(114)の分野を専門としていることを示しています。「合計」行は、研究者の大半が、資金カテゴリC(310)に分類されることを示しています。セル度数では、資金カテゴリCに分類される化学の研究者の観測頻度が最大(49)となっています。
観測度数は、変数が互いに独立している場合の、期待されるセル内の観測値の度数です。Minitabでは、期待度数を、行の合計と列の合計を掛け合わせて、観測値の合計数で割って計算します。
A | B | C | D | E | |
---|---|---|---|---|---|
地質学 | 3.310 | 13.668 | 33.103 | 13.775 | 21.143 |
生物化学 | 1.129 | 4.663 | 11.294 | 4.700 | 7.214 |
化学 | 5.063 | 20.905 | 50.628 | 21.068 | 32.337 |
動物学 | 4.673 | 19.296 | 46.734 | 19.447 | 29.849 |
物理学 | 4.440 | 18.332 | 44.397 | 18.475 | 28.357 |
工学 | 3.427 | 14.151 | 34.271 | 14.261 | 21.889 |
微生物学 | 1.441 | 5.950 | 14.410 | 5.996 | 9.204 |
植物学 | 3.349 | 13.829 | 33.492 | 13.937 | 21.392 |
統計学 | 1.129 | 4.663 | 11.294 | 4.700 | 7.214 |
数学 | 3.038 | 12.543 | 30.377 | 12.641 | 19.402 |
次の期待度数表は、資金と学問分野の関係が独立しているものとして、学問分野と資金カテゴリ(A、B、C、D、E)ごとの研究者の期待度数を示します。研究者の大半が化学に、大半の学部が資金カテゴリCに属しているので、これらのカテゴリの組み合わせの期待が最も高くなります(およそ51)。
観測度数-期待度数は、変数が互いに独立している場合の、実際のセル内の観測値の度数と期待するセル内の観測値の度数の差です。
観測度数と期待度数の差を使用して、データ内の起こりうる関係の根拠があるかどうかを確認します。2つの変数が関連している場合、1つの変数に対する観測値の分布はもう1つの変数のカテゴリに応じて異なります。結果的に、観測度数と期待度数の差の大きさは相対的に大きくなります。2つの変数が独立している場合、1つの変数に対する観測値の分布はもう1つの変数の全カテゴリと類似します。結果的に、観測度数と期待度数の差の大きさは相対的に小さくなります。
A | B | C | D | E | |
---|---|---|---|---|---|
地質学 | -0.310 | 5.332 | 5.897 | 0.225 | -11.143 |
生物化学 | -0.129 | -2.663 | 1.706 | -3.700 | 4.786 |
化学 | 0.937 | 4.095 | -1.628 | -0.068 | -3.337 |
動物学 | -1.673 | -4.296 | -5.734 | 15.553 | -3.849 |
物理学 | 5.560 | 3.668 | 2.603 | -9.475 | -2.357 |
工学 | -0.427 | -3.151 | -9.271 | 0.739 | 12.111 |
微生物学 | -0.441 | 0.050 | -0.410 | -0.996 | 1.796 |
植物学 | -3.349 | -1.829 | 0.508 | 3.063 | 1.608 |
統計学 | 0.871 | 0.337 | -0.294 | -0.700 | -0.214 |
数学 | -1.038 | -1.543 | 6.623 | -4.641 | 0.598 |
この表では、観測度数と期待度数の差の大きさは、動物学かつ資金カテゴリD(15.553)や工学かつ資金カテゴリE(12.111)の場合に相対的に大きくなります。これらのセルでは、観測度数は、変数が独立している場合に期待する度数よりも大きくなります。差の大きさは、地質学かつ資金カテゴリE(-11.143)の場合にも相対的に大きくなります。この度数では、観測度数は、変数が独立している場合に期待する度数よりも小さくなります。このため、工学部の資金調達難は期待よりもかなり大きく、地質学部の資金調達難は期待よりもかなり小さいと結論付けられます。
Minitabでは、各セルのカイ二乗統計量への寄与度がカイ二乗距離として表示されます。各セルのカイ二乗距離は、各セルの相違に起因する合計カイ二乗統計量を定量化します。
Minitabでは、各セルのカイ二乗統計量への寄与度が、そのセルの期待値で割った、セルの観測値と期待値の間の差の平方として計算されます。カイ二乗合計は、すべてのセルの値の和です。
セルごとのカイ二乗距離を比較して、カイ二乗合計に最も寄与するセルを評価できます。観測セル度数と期待セル度数が大きく異なる場合、セルのカイ二乗値は大きくなります。このため、セル内のカイ二乗距離が大きくなるほど、行と列のカテゴリ間の関係性が期待されるよりも強くなることがあることを示します。
A | B | C | D | E | 合計 | |
---|---|---|---|---|---|---|
地質学 | 0.029 | 2.080 | 1.050 | 0.004 | 5.873 | 9.036 |
生物化学 | 0.015 | 1.521 | 0.258 | 2.913 | 3.176 | 7.882 |
化学 | 0.173 | 0.802 | 0.052 | 0.000 | 0.344 | 1.373 |
動物学 | 0.599 | 0.957 | 0.703 | 12.438 | 0.496 | 15.194 |
物理学 | 6.964 | 0.734 | 0.153 | 4.859 | 0.196 | 12.906 |
工学 | 0.053 | 0.702 | 2.508 | 0.038 | 6.700 | 10.001 |
微生物学 | 0.135 | 0.000 | 0.012 | 0.166 | 0.351 | 0.663 |
植物学 | 3.349 | 0.242 | 0.008 | 0.673 | 0.121 | 4.393 |
統計学 | 0.671 | 0.024 | 0.008 | 0.104 | 0.006 | 0.814 |
数学 | 0.354 | 0.190 | 1.444 | 1.704 | 0.018 | 3.710 |
合計 | 12.343 | 7.252 | 6.196 | 22.899 | 17.282 | 65.972 |
この表では、動物学と資金カテゴリDのセルが12.438であり、全体カイ二乗(65.972)への寄与度が最も大きいです。行カテゴリの中では、動物学(15.194)、物理学(12.906)、工学(10.001)が全体カイ二乗に最も寄与します。列カテゴリの中では、資金水準D(22.899)とE(17.282)が全体カイ二乗に最も寄与します。
セル変動は、セル内のカイ二乗値を分割表の総度数で割った値です。すべてのセル変動の和は、全変動(または単に「変動」)と呼びます。セルの相対的変動は、セル変動を全変動で割った数です。行の相対的変動は、行のセル変動の和を全変動で割った数です。列の相対的変動は、列のセル変動の和を全変動で割った数です。
相対的変動を使用して、カテゴリとデータ内の分散への寄与度の関係の強さを評価します。値が高いほど、一般的には、関係性は強くなり、データ内の期待値から得られるばらつき全体の比率が大きくなることを示します。
A | B | C | D | E | 合計 | |
---|---|---|---|---|---|---|
地質学 | 0.000 | 0.032 | 0.016 | 0.000 | 0.089 | 0.137 |
生物化学 | 0.000 | 0.023 | 0.004 | 0.044 | 0.048 | 0.119 |
化学 | 0.003 | 0.012 | 0.001 | 0.000 | 0.005 | 0.021 |
動物学 | 0.009 | 0.015 | 0.011 | 0.189 | 0.008 | 0.230 |
物理学 | 0.106 | 0.011 | 0.002 | 0.074 | 0.003 | 0.196 |
工学 | 0.001 | 0.011 | 0.038 | 0.001 | 0.102 | 0.152 |
微生物学 | 0.002 | 0.000 | 0.000 | 0.003 | 0.005 | 0.010 |
植物学 | 0.051 | 0.004 | 0.000 | 0.010 | 0.002 | 0.067 |
統計学 | 0.010 | 0.000 | 0.000 | 0.002 | 0.000 | 0.012 |
数学 | 0.005 | 0.003 | 0.022 | 0.026 | 0.000 | 0.056 |
合計 | 0.187 | 0.110 | 0.094 | 0.347 | 0.262 | 1.000 |
相対的変動表は、カイ二乗統計量の合計に対する各セルの相対寄与度を示します。セル内の相対的変動が大きくなるほど、行と列のカテゴリ間の関係は強くなります。この表では、動物学と資金カテゴリDのセルの相対的変動が最大(0.189)になり、表の中で最も強い関連性となります。この表は、行ごと、列ごとの相対的変動の全体を示しています。