多重コレスポンデンス分析の主要な結果を解釈する

多重コレスポンデンス分析を解釈するには、次の手順を実行します。主要な結果には、主成分、変動、変動比率、品質、質量、列プロットがあります。

ステップ1:分数を判断する

変動の比率を使用して、データの期待値から得られる偏差の大部分を占める主成分(主軸とも呼ばれる)の最小値を決定します。全変動の許容可能な比率を説明する主成分を保持します。許容可能な水準は用途によって変わります。第1成分、第2成分、または第3成分が全変動の大部分を占めるのが理想的です。

必要な主成分の最小値が、分析に入力する成分数と一致しない場合、適切な成分数を使用して分析を繰り返します。

指標行列の分析

変動比率累積ヒストグラム
10.40320.40320.4032******************************
20.25200.25200.6552******************
30.18990.18990.8451**************
40.15490.15491.0000***********
合計1.0000     
主要な結果:軸、比率、累積比率

これらの結果は、全変動を4つの成分に分解したものを示します。4成分が説明される全変動は1.000です。全変動のうち、第1成分(軸)は変動の40.32%、第2成分は25.20%を占めます。これら2つの成分で、全変動の65.52%を占めます。このため、分析で2つの成分を指定しても不十分なことがあります。第3成分を追加することで、変動の累積比率は84.51%に上昇します。

ステップ2:主成分を解釈する

品質の値を使用して、カテゴリごとの成分によって表される変動の比率を判断します。品質の値は常に0~1の範囲にあります。品質の値が大きいほど、行または列は成分によって十分に表現されます。品質の値が小さいほど、十分に表現されないことを示します。品質の値により、成分は解釈しやすくなります。

列の寄与度の値を使用して、各成分の変動に最も寄与するカテゴリを評価します。成分を視覚的に解釈するには、列プロットを使用します。

指標行列の分析

変動比率累積ヒストグラム
10.40320.40320.4032******************************
20.25200.25200.6552******************
30.18990.18990.8451**************
40.15490.15491.0000***********
合計1.0000     

列寄与度






成分1成分2
ID名前品質質量変動座標相関寄与座標相関寄与
1小さい0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2基準0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3車外放出なし0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4車外放出あり0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5衝突0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6転倒0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7軽度0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8重度0.56800.11470.13530.76920.50180.16840.27950.06630.0356
主要な結果:品質、寄与度、列プロット

この分析では、自動車事故に関連するデータに対して2つの主成分を計算します。「列の寄与度」表では、品質の最大値は、車のサイズが「小さい」場合(0.965)と「標準」の場合(0.965)に発生しています。したがって、この2つのカテゴリを最も表しているのは、2つの成分です。事故の重度が最も表現されず、品質の値は「重度」でも「軽度」でも0.568です。「転倒」(0.291)と「車外放出あり」(0.250)が成分1の変動に最も寄与しています。車のサイズが「小さい」(0.771)と「標準」(0.158)は、成分2の変動に最も寄与しています。ただし、2つの成分はこれらのデータのばらつきを十分には説明できないので、これらの結果は注意して解釈する必要があります。

列プロットは主列座標を示します。「転倒」と「車外放出あり」が水平軸の原点からかなり離れているので、成分1は、これら2つのカテゴリを最もよく説明します。重度と軽度は水平軸の原点の反対側にあります。このため、成分1ではこれらのカテゴリの値を対比します。これは、成分1のこうしたカテゴリで相対的に高い寄与度に当てはまります。成分2では、「小さい」という車のサイズを最もよく説明し、「小さい」とその他のカテゴリを対比します。

ステップ3:カテゴリの変動を調べる

列カテゴリの計算された変動値を調べます。カテゴリが期待値から大きく離れるほど、変動値は大きくなり、カイ二乗値全体への寄与度も大きくなります。

列寄与度






成分1成分2
ID名前品質質量変動座標相関寄与座標相関寄与
1小さい0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2基準0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3車外放出なし0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4車外放出あり0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5衝突0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6転倒0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7軽度0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8重度0.56800.11470.13530.76920.50180.16840.27950.06630.0356
主要な結果:列変動

列寄与度表では、変動(Inert)という列は、各カテゴリが寄与する全変動の比率です。したがって、車外放出ありは、期待値から最も離れており、カイ二乗統計量全体に21.3%寄与します。