군집의 최종 그룹화 결정

군집의 최종 그룹화(최종 분할이라고도 함)는 공통적인 특성을 공유하는 관측치 또는 변수들의 집단을 식별할 군집의 그룹화입니다. 최종 그룹화에 대해 결정하는 것을 덴드로그램 커팅이라고도 합니다. 완전한 덴드로그램(트리 다이어그램 또는 수형도)은 관측치 또는 변수를 하나의 군집으로 합병하는 단계를 그래픽으로 표시한 것입니다. 덴드로그램 커팅은 덴드로그램에 선을 그려 최종 그룹화를 지정하는 것과 유사합니다. 다음 단계는 덴드로그램 커팅 위치를 결정하는 데 도움이 됩니다.

  1. 기본 설정(최종 분할에 군집 1개)을 사용하여 군집 분석을 수행합니다. Minitab에서는 가능한 모든 군집 수에 대한 결과를 표시합니다.
  2. 표 형식 결과와 덴드로그램에서 유사성 및 거리 수준을 확인합니다. 덴드로그램의 수평선 위에 마우스 포인터를 놓으면 유사성 수준을 볼 수 있습니다. 특정 단계의 유사성 수준은 데이터의 관측치 간 최대 거리에 대한 해당 단계의 최소 거리를 백분율로 나타낸 것입니다.
  3. 최종 분할을 수행할 위치를 선택합니다. 한 단계에서 다음 단계로 갈 때 유사성 또는 거리 값이 바뀌는 패턴을 보면 최종 그룹을 쉽게 선택할 수 있습니다. 데이터에 대해 의미가 있는 경우 값이 급격히 바뀌는 단계가 덴드로그램을 커팅하기에 적합한 지점이 될 수 있습니다.
  4. 군집 수 또는 유사성 수준을 사용하여 군집 분석 절차를 다시 실행함으로써 덴드로그램 커팅에 필요한 그룹 수 또는 유사성 수준을 얻을 수 있습니다.
  5. 그룹화가 논리적인지 확인하려면 최종 분할된 결과의 군집을 살펴봅니다. 또한 서로 다른 최종 그룹화의 덴드로그램을 살펴보고 데이터에 가장 의미 있는 그룹을 결정할 수 있습니다.
참고

일부 데이터 집합의 경우에는 평균, 중심, 중위수 및 Ward의 연결 방법으로 계층적 덴드로그램이 생성되지 않습니다. 즉, 결합 거리가 각 단계에서 항상 증가하지는 않습니다. 덴드로그램에서 이러한 단계는 위쪽보다 아래쪽으로 이동하는 연결을 생성합니다.