합병 단계

합병 단계의 결과에 대해 제공되는 모든 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

이 항목의 내용

단계
군집 수
유사성 수준
거리 수준
결합된 군집
새 군집
새 군집의 관측치 수

단계

군집을 결합하는 합병 절차의 단계 수입니다. 각 단계에서 새 군집이 기본 군집에 결합되고 유사성 수준과 거리 수준이 계산됩니다.

군집 수

합병 과정의 각 단계에서 형성된 군집의 수입니다. 첫 번째 단계 전에 군집 수는 총 관측치 수(군집 관측치의 경우) 또는 총 변수 수(군집 변수의 경우)와 같습니다. 첫 번째 단계에서는 두 군집이 결합하여 새 군집을 형성합니다. 이후의 각 단계에서는 또 하나의 군집이 기존 군집에 결합되어 새 군집을 형성합니다. 최종 단계에서는 모든 관측치 또는 변수가 하나의 군집으로 결합됩니다.

주 대화 상자에 군집 수를 입력하여 데이터의 최종 분할을 지정할 수 있습니다. 선택한 연결 방법 및 거리 측도에 따라 군집화 결과가 크게 달라집니다.

유사성 수준

각 합병 단계에서 데이터의 관측 개체 간 최대 거리와 비교한 군집 간 최소 거리의 백분율입니다. 두 군집 i와 j 사이의 유사성 s(ij)는 s(ij) = 100 * [1-d(ij)) / d(max]입니다. 여기서 d(max)는 i와 j 사이의 거리에 대한 항목 d(ij)를 가진 원래 거리 행렬 D의 최대값입니다.

해석

데이터에 대한 최종 그룹을 결정하려면 각 단계에서 결합된 군집에 대한 유사성 수준을 사용합니다.단계 간에 유사성 수준이 급격하게 변경되었는지 확인합니다. 유사성이 급격하게 변경되기 전의 단계가 최종 분할에 대한 좋은 컷오프 점을 제공할 수도 있습니다. 최종 분할의 경우 군집의 유사성 수준이 상당히 높아야 합니다. 또한 연구에 가장 유의한 최종 그룹을 결정하려면 데이터에 대한 실제 지식을 활용해야 합니다.

예를 들어, 다음 합병 표는 유사성 수준이 15단계까지 약 3 이하씩 감소한다는 것을 보여줍니다. 군집 수가 4에서 3으로 변경되는 16, 17단계에서는 유사성이 (62.0036에서 41.0474로) 약 20 이상씩 감소하며, 이 결과는 4개의 군집이 최종 분할에 충분할 수 있음을 나타냅니다. 이 그룹화 방식이 직관적인 의미를 가지면 이 방식을 선택하는 것이 좋습니다.

합병 단계

단계	군집 수	유사성 수준	거리 수준	결합된 군집		새 군집	새 군집의 관측치 수
1	19	96.6005	0.16275	13	16	13	2
2	18	95.4642	0.21715	17	20	17	2
3	17	95.2648	0.22669	6	9	6	2
4	16	92.9178	0.33905	17	18	17	3
5	15	90.5296	0.45339	11	15	11	2
6	14	90.3124	0.46378	12	19	12	2
7	13	88.2431	0.56285	2	14	2	2
8	12	88.2431	0.56285	5	8	5	2
9	11	85.9744	0.67146	6	10	6	3
10	10	83.0639	0.81080	7	13	7	3
11	9	83.0639	0.81080	1	3	1	2
12	8	81.4039	0.89027	2	17	2	5
13	7	79.8185	0.96617	6	11	6	5
14	6	78.7534	1.01716	4	12	4	3
15	5	66.2112	1.61760	2	5	2	7
16	4	62.0036	1.81904	1	6	1	7
17	3	41.0474	2.82229	1	4	1	10
18	2	40.1718	2.86421	2	7	2	10
19	1	0.0000	4.78739	1	2	1	20

팁

각 단계에서 유사성 수준을 시각적으로 평가하려면 덴드로그램을 사용하십시오.

거리 수준

각 단계에서 결합된 군집(선택한 연결 방법 사용) 또는 변수(선택한 거리 측도 사용) 사이의 거리입니다. Minitab에서는 사용자가 주 대화 상자에서 선택한 연결 방법과 거리 측도를 기준으로 거리 수준을 계산합니다.

해석

데이터에 대한 최종 그룹화를 결정하려면 각 단계에서 결합된 군집에 대한 거리 수준을 사용합니다. 단계 간에 거리 수준이 급격하게 변경되었는지 확인합니다. 거리가 급격하게 변경되기 전의 단계가 최종 분할에 대한 좋은 컷오프 점을 제공할 수도 있습니다. 최종 분할의 경우, 군집의 거리 수준이 상당히 작아야 합니다. 또한 연구에 가장 유의한 최종 그룹화를 결정하려면 데이터에 대한 실제 지식을 사용해야 합니다.

예를 들어, 다음 합병 표는 처음 15단계 동안 거리 수준이 약 0.6 이하 감소한다는 것을 보여줍니다. 그러나 군집 수가 4에서 3으로 변경되는 16단계와 17단계에서는 거리 수준이 (1.81904에서 2.82229로) 1 이상 증가합니다. 이 결과는 4개의 군집이 최종 분할에 충분하다는 것을 나타냅니다. 이 그룹화 방식이 직관적인 의미를 가지면 이 방식을 선택하는 것이 좋습니다.

합병 단계

단계	군집 수	유사성 수준	거리 수준	결합된 군집		새 군집	새 군집의 관측치 수
1	19	96.6005	0.16275	13	16	13	2
2	18	95.4642	0.21715	17	20	17	2
3	17	95.2648	0.22669	6	9	6	2
4	16	92.9178	0.33905	17	18	17	3
5	15	90.5296	0.45339	11	15	11	2
6	14	90.3124	0.46378	12	19	12	2
7	13	88.2431	0.56285	2	14	2	2
8	12	88.2431	0.56285	5	8	5	2
9	11	85.9744	0.67146	6	10	6	3
10	10	83.0639	0.81080	7	13	7	3
11	9	83.0639	0.81080	1	3	1	2
12	8	81.4039	0.89027	2	17	2	5
13	7	79.8185	0.96617	6	11	6	5
14	6	78.7534	1.01716	4	12	4	3
15	5	66.2112	1.61760	2	5	2	7
16	4	62.0036	1.81904	1	6	1	7
17	3	41.0474	2.82229	1	4	1	10
18	2	40.1718	2.86421	2	7	2	10
19	1	0.0000	4.78739	1	2	1	20

결합된 군집

합병 공정의 각 단계에서 새 군집을 형성하기 위해 결합된 두 군집입니다.

새 군집

합병 공정의 각 단계에서 형성된 새 군집의 식별 번호입니다. 새 군집의 식별 번호는 항상 결합된 두 군집의 식별 번호 중 작은 값입니다. 예를 들어, 군집 2와 군집 9를 결합한 경우 새로 형성된 군집은 군집 2가 됩니다.

새 군집의 관측치 수

합병 과정의 각 단계에서 각 새 군집의 관측치 수입니다. 최종 단계에서 모든 관측치는 하나의 군집으로 결합합니다. 따라서 마지막 단계에서 새 군집의 관측치 수는 데이터의 총 관측치 수와 같습니다.

참고

변수 군집의 경우 관측치 수는 새 군집의 변수 수입니다.