다중 대응 분석에 대한 모든 통계량 및 그래프 해석

다중 대응 분석과 함께 제공되는 모든 통계 및 그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

Minitab에서는 각 주축(주성분이라고도 함)을 계산합니다. Minitab에서는 전체 이너시아를 설명하는 정도를 기준으로 주성분을 정렬합니다. 첫 번째 주성분(축)이 대부분의 이너시아를 설명합니다. 두 번째 주성분(축)이 나머지 이너시아의 대부분을 설명하며, 이런 식으로 계속됩니다.

해석

주축을 사용하면 데이터 변동성의 대부분을 설명하는 성분을 확인할 수 있습니다.

지시 행렬의 분석

이너시아비율누적히스토그램
10.40320.40320.4032******************************
20.25200.25200.6552******************
30.18990.18990.8451**************
40.15490.15491.0000***********
총계1.0000     

이 결과는 전체 이너시아가 네 개의 성분으로 분해된 것을 보여줍니다. 네 개의 성분에 의해 설명되는 전체 이너시아는 1.00입니다. 전체 이너시아 중에서 첫 번째 성분이 이너시아의 40.32%를 설명하며 두 번째 성분이 이너시아의 25.20%를 설명합니다. 이 두 개의 성분이 전체 이너시아의 65.52%를 설명합니다. 따라서 분석에 대해 두 개의 성분을 지정하는 것이 충분하지 않을 수도 있습니다. 세 번째 성분을 추가하면 이너시아의 누적 비율이 84.51%로 증가합니다.

이너시아

성분에 대한 이너시아는 성분이 설명하는 변동량을 나타냅니다. 열에 대한 이너시아는 해당 범주에 대한 값이 어느 범주형 변수도 상관되지 않는다는 가정에서의 기대값과 얼마나 다른지 설명합니다. Minitab에서는 성분에 대한 이너시아를 계산하기 위해 각 범주에 대한 이너시아에 해당 성분에 대한 범주의 상관 계수를 곱한 다음 결과 값을 더합니다.

해석

성분의 이너시아를 사용하면 데이터 변동성의 대부분을 설명하는 성분을 확인할 수 있습니다.

지시 행렬의 분석

이너시아비율누적히스토그램
10.40320.40320.4032******************************
20.25200.25200.6552******************
30.18990.18990.8451**************
40.15490.15491.0000***********
총계1.0000     

이 결과는 전체 이너시아가 네 개의 성분으로 분해된 것을 보여줍니다. 네 개의 성분에 의해 설명되는 전체 이너시아는 1.00입니다. 전체 이너시아 중에서 첫 번째 성분(축)이 이너시아의 40.32%를 설명하며 두 번째 성분이 이너시아의 25.20%를 설명합니다. 이 두 개의 성분이 전체 이너시아의 65.52%를 설명합니다. 따라서 분석을 위해 두 개의 성분을 지정하는 것이 충분하지 않을 수도 있습니다. 세 번째 성분을 추가하면 이너시아의 누적 비율이 84.51%로 증가합니다.

열 이너시아를 사용하면 어느 범주형 변수도 상관되지 않는다는 가정에서 가장 비정상적인 범주를 확인할 수 있습니다. 열 이너시아의 경우 (1/범주의 수)와의 차이가 가장 비정상적인 범주를 나타냅니다.

열 기여






성분 1성분 2
ID이름품질질량이너시아좌표상관 계수Contr좌표상관 계수Contr
1소형0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2표준형0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3이탈되지 않음0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4이탈0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5충돌0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6전복0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7경미0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8심각0.56800.11470.13530.76920.50180.16840.27950.06630.0356

열 기여 표에서 이너시아 열은 각 범주가 전체 이너시아에 기여하는 비율입니다. 따라서 이탈은 기대값에서 가장 크게 벗어나며 전체 카이-제곱 통계량의 21.3%를 기여합니다.

비율, 누적 및 히스토그램

비율은 각 주성분(축)이 설명하는 전체 이너시아(모든 성분이 설명하는 이너시아)의 비율입니다. Minitab에서는 가장 큰 비율에서 가장 작은 비율의 순서로 성분을 표시합니다. 각 성분은 히스토그램에 시각적으로 표현됩니다.

누적 비율은 성분(축)이 추가됨에 따라 비율의 누적합을 나타냅니다.

해석

비율과 누적 비율을 사용하면 전체 이너시아의 대부분을 설명하기에 충분한 성분 수를 확인할 수 있습니다. 이상적으로는 두 개 또는 세 개의 성분이 전체 이너시아의 대부분을 설명하며, 다른 성분보다 더 중요합니다.

지시 행렬의 분석

이너시아비율누적히스토그램
10.40320.40320.4032******************************
20.25200.25200.6552******************
30.18990.18990.8451**************
40.15490.15491.0000***********
총계1.0000     

이 결과는 전체 이너시아가 네 개의 성분으로 분해된 것을 보여줍니다. 네 개의 성분에 의해 설명되는 전체 이너시아는 1.000입니다. 전체 이너시아 중에서 첫 번째 성분(축)이 이너시아의 40.32%를 설명하며 두 번째 성분이 이너시아의 25.20%를 설명합니다. 이 두 개의 성분이 전체 이너시아의 65.52%를 설명합니다. 따라서 분석을 위해 두 개의 성분을 지정하는 것이 충분하지 않을 수도 있습니다. 세 번째 성분을 추가하면 이너시아의 누적 비율이 84.51%로 증가합니다.

품질

품질은 선택한 차수에서 원점으로부터 점에 이르는 거리의 제곱을 최대 차수로 정의된 공간에서 원점으로부터 점에 이르는 거리의 제곱으로 나눈 값입니다. Minitab에서는 각 범주에 대한 품질 값을 계산합니다.

해석

품질 값을 사용하면 각 범주에 대한 성분이 나타내는 이너시아의 비율을 확인할 수 있습니다. 품질은 항상 0과 1 사이의 숫자이며, 품질 값이 클수록 성분이 범주를 잘 나타냅니다. 값이 작을수록 잘 나타내지 못합니다. 품질 값은 성분을 해석하는 데 도움이 됩니다.

열에 대한 기여도 값을 사용하면 어느 범주가 각 성분의 이너시아에 가장 크게 기여하는지 평가할 수 있습니다.

열 기여






성분 1성분 2
ID이름품질질량이너시아좌표상관 계수Contr좌표상관 계수Contr
1소형0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2표준형0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3이탈되지 않음0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4이탈0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5충돌0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6전복0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7경미0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8심각0.56800.11470.13530.76920.50180.16840.27950.06630.0356

이 분석에서 Minitab은 자동차 사고와 관련된 데이터에 대한 두 주성분을 계산합니다. 열 기여 표에서 소형(0.965) 및 표준형(0.965) 자동차 크기에 대한 품질 값이 가장 큽니다. 따라서, 두 성분이 이 두 범주를 가장 잘 나타냅니다. 운전자 이탈은 범주를 가장 잘 나타내지 못하며, 이탈과 이탈되지 않음에 대한 품질 값은 0.474입니다. 전복(0.291)과 이탈(0.250)이 성분 1의 이너시아에 가장 크게 기여하며, 소형(0.771) 및 표준형(0.158) 자동차 크기가 성분 2의 이너시아에 가장 크게 기여합니다. 그러나 이 결과는 두 성분이 이러한 데이터의 변동성을 적절하게 설명하지 못할 수도 있으므로 해석 시 주의해야 합니다.

질량

질량은 각 범주에 대한 상대 빈도 행렬의 총계입니다. 열의 질량은 열의 모든 빈도 합을 모든 빈도 합으로 나눈 값입니다.

해석

질량을 사용하면 각 열 범주의 비율을 확인할 수 있습니다. 질량 값이 작을수록 열 범주의 상대 빈도가 더 높습니다. 모든 열 범주에 대한 총 질량은 1(100%)과 같습니다.

열 기여






성분 1성분 2
ID이름품질질량이너시아좌표상관 계수Contr좌표상관 계수Contr
1소형0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2표준형0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3이탈되지 않음0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4이탈0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5충돌0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6전복0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7경미0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8심각0.56800.11470.13530.76920.50180.16840.27950.06630.0356

이 열 기여 표는 자동차 사고와 관련된 열 범주를 평가합니다. 이탈되지 않음 범주의 질량이 가장 높고(0.213) 데이터의 21.3%를 설명합니다. 이탈 범주의 질량이 가장 낮고(0.037) 데이터의 3.7%를 설명합니다. 따라서 이 데이터의 경우 운전자 이탈을 초래하는 사고는 상대적으로 드문 반면 운전자 이탈을 초래하지 않은 사고가 더 일반적입니다.

좌표

Minitab에서는 각 성분에 대한 열 주좌표(좌표)를 계산합니다. 열 주좌표는 열 그림에 표시되는 좌표입니다.

열 주좌표에 의해 정의되는 점을 시각적으로 표시하려면 열 그림을 사용하십시오.

상관 계수

열 상관 계수 값은 열의 이너시아에 대한 성분의 기여도를 나타냅니다. 상관 계수 값의 범위는 0에서 1까지입니다.

해석

상관 계수 값을 사용하면 각 성분을 열 이너시아에 대한 기여도의 관점에서 해석할 수 있습니다. 값이 1에 가까우면 성분이 많은 양의 이너시아를 설명한다는 것을 나타냅니다. 값이 0에 가까우면 성분이 이너시아에 거의 기여하지 않는다는 것을 나타냅니다.

열 기여






성분 1성분 2
ID이름품질질량이너시아좌표상관 계수Contr좌표상관 계수Contr
1소형0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2표준형0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3이탈되지 않음0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4이탈0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5충돌0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6전복0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7경미0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8심각0.56800.11470.13530.76920.50180.16840.27950.06630.0356

이 열 기여 표는 자동차 사고와 관련된 열 범주를 평가합니다. 성분 1은 사고 유형의 이너시아 대부분을 설명하지만(충돌과 전복에 대한 상관 계수 = 0.610) 자동차 크기의 이너시아를 거의 설명하지 않습니다(소형과 표준형에 대한 상관 계수 = 0.030).

Contr

각 열 범주의 각 성분의 이너시아에 대한 기여도(Contr)입니다.

해석

열 범주의 기여도 값을 사용하면 성분을 해석할 수 있습니다.

열 기여






성분 1성분 2
ID이름품질질량이너시아좌표상관 계수Contr좌표상관 계수Contr
1소형0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2표준형0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3이탈되지 않음0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4이탈0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5충돌0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6전복0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7경미0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8심각0.56800.11470.13530.76920.50180.16840.27950.06630.0356

이 열 기여 표는 자동차 사고와 관련된 열 범주를 평가합니다. 이탈(Contr = 0250)과 전복(Contr = 0.291)이 성분 1의 이너시아에 가장 크게 기여합니다. 소형 (Contr = 0.771) 및 표준형(Contr = 0.158) 자동차 크기가 성분 2의 이너시아에 가장 크게 기여합니다.

열 그림

열 그림에는 열 범주에 대한 주성분이 표시됩니다. Minitab에서는 열 점을 파란색 사각형으로 표시합니다.
참고

기본적으로 Minitab에서는 가장 큰 전체 이너시아 양을 설명하는 처음 두 주성분에 대한 점을 표시합니다. 그림에 다른 주성분(축)을 표시하려면 분석을 수행할 때 그래프을 클릭하고 성분 번호를 입력하십시오.

해석

열 그림을 사용하면 열 범주 간의 관계를 확인하고 주성분과 열 범주 간의 관계를 해석할 수 있습니다. 원점에서 더 멀리 떨어짐 점이 더 영향력 있는 범주를 나타냅니다. 그림의 반대쪽에 있는 점은 한 성분이 이들 범주를 대비시킨다는 것을 나타냅니다.

이 열 그림에서는 이탈과 전복이 성분 1에 대한 수평 축을 따라 원점에서 가장 멀리 떨어져 있습니다 이는 성분 1의 범주에 대해 상대적으로 높은 기여도에 해당합니다 이탈과 이탈되지 않음, 심각과 경미가 원점의 반대쪽에 있기 때문에 성분 1은 이들 성분 값을 대비시킵니다. 성분 2는 수직 축에 표시됩니다. 소형 차 크기는 수직 축 한 쪽의 다른 범주에서 멀리 떨어져 있습니다. 따라서 성분 2가 소형 자동차 크기를 다른 범주와 대조합니다.

지시 표

지시 표에는 데이터 내 모든 관측치가 지시 변수의 형태로 표시됩니다. 각 지시 변수(열)는 범주형 변수의 한 수준을 나타내며, 각 관측치(행)는 해당 범주에 속하는지(1) 또는 속하지 않는지(0) 여부에 따라 이진수 값을 갖습니다. 따라서 모든 열의 값은 0 또는 1이어야 합니다.

결과에 지시 표를 포함하려면 분석을 수행할 때 결과을 클릭하고 표를 표시하는 옵션을 선택해야 합니다.

이 지시 표에서 1행의 첫 번째 관측치는 흡연을 하고 정기적인 운동을 하는 정상 체중의 남성을 나타냅니다. 2행의 두 번째 관측치는 흡연을 하지 않고 정기적인 운동을 하는 과체중의 여성을 나타냅니다.
C1 C2 C3 C4 C5 C6 C7 C8 C8
남성 여성 정상 체중 저체중 과체중 흡연 흡연 안 함 운동 운동 안 함
1 0 1 0 0 1 0 1 0
0 1 0 0 1 0 1 1 0
0 1 1 0 0 0 1 0 1
1 0 1 0 0 0 1 1 0
0 1 0 1 0 0 1 0 1
0 1 0 0 1 1 0 0 1

Burt 표

Burt 표는 범주형 변수 간의 관계를 시각적으로 표시하고 분석하는 데 사용하는 대칭 행렬입니다. 결과에 지시 표를 포함하려면 분석을 수행할 때 결과을 클릭하고 표를 표시하는 옵션을 선택해야 합니다.

Burt 표에는 각 범주형 변수의 각 수준(범주)에 대해 열과 행이 하나씩 있습니다. 예를 들어, 데이터가 성별(남성, 여성), 활동 수준(적음, 중간, 많음), 나이(<20, 20-50, >50) 등 3개의 범주형 변수로 나뉘는 경우 Burt 표에는 2 + 3 + 3 = 8개의 행과 8개의 열이 포함됩니다.
  남성 여성 적음 중간 높음 <20 20-50 >50
남성 87 0 33 45 9 26 47 14
여성 0 163 27 111 25 43 89 31
적음 33 27 60 0 0 14 48 7
중간 45 111 0 111 0 14 107 18
많음 9 25 0 0 79 9 30 3
<20 26 43 14 14 9 37 0 0
20-50 47 89 48 107 30 0 185 0
>50 14 31 7 18 3 0 0 28

Burt 표의 각 항목은 해당하는 행과 열의 범주를 만족하는 관측치 수를 표시합니다. 예를 들어, 1행과 3열이 만나는 부분의 항목은 남성이고 활동이 적은 관측치 수(33)를 나타냅니다. 1행과 2열의 항목은 남성인 동시에 여성인 관측치 수(0)를 나타냅니다.

각 범주의 전체 관측치 수는 왼쪽 위에서 오른쪽 아래까지 대각 행렬 항목에 표시됩니다. 대각 행렬 항목은 행 제목과 열 제목이 같습니다. 예를 들어, 1행과 1열의 항목은 전체 남성 수(87)를 나타내며 2행과 2열의 항목은 전체 여성 수(163)를 나타냅니다.