관측 개체 군집 분석

한 스포츠 용품 회사의 디자이너가 새 축구 골키퍼 장갑을 검사하려고 합니다. 디자이너는 선수 20명에게 새 장갑을 착용하도록 하고 선수의 성별, 키, 몸무게, 잘 쓰는 손에 대한 정보를 수집합니다. 디자이너는 이러한 범주의 유사성을 기준으로 선수들을 분류하려고 합니다.

  1. 표본 데이터 집합장갑시험자.MTW을 엽니다.
  2. 통계분석 > 다변량 > 관측 개체 군집 분석을 선택합니다.
  3. 변수 또는 거리 행렬성별무게잘 쓰는 손을 입력합니다.
  4. 연결 방법에서 완전을 선택합니다. 거리 측도에서 Euclid을 선택합니다.
  5. 변수 표준화을 선택합니다.
  6. 덴드로그램 표시을 선택합니다.
  7. 확인을 클릭합니다.

결과 해석

표에는 각 단계에서 결합된 군집, 군집 사이의 거리, 군집의 유사성이 표시됩니다.
  • 유사성 수준은 15단계까지 약 3 이하씩 감소합니다. 군집 수가 4에서 3으로 변경되는 16단계와 17단계에서는 유사성 수준이 (62.0036에서 41.0474로) 20 이상 감소합니다.
  • 결합된 군집 사이의 거리는 처음에 약 0.6 이하 감소합니다. 군집 수가 4에서 3으로 변경되는 16단계와 17단계에서는 거리 수준이 (1.81904에서 2.82229로) 1 이상 증가합니다.

거리 및 유사성 결과는 4개의 군집이 최종 분할에 충분하다는 것을 나타냅니다. 이 그룹화 방식이 설계자에게 직관적인 의미를 가지면 이 방식을 선택하는 것이 좋습니다. 덴드로그램에서는 표의 정보를 트리 다이어그램 형식으로 표시합니다.

설계자는 분석을 다시 실행하고 최종 분할에 4개의 군집을 지정해야 합니다. 최종 분할을 지정하면 Minitab에서 최종 분할에 포함된 각 군집의 특성을 설명하는 추가 표를 표시합니다.

표준화 변수, Euclid 거리, 완전 연결

합병 단계

단계군집 수유사성 수준거리 수준결합된 군집새 군집새 군집의 관측치 수
11996.60050.162751316132
21895.46420.217151720172
31795.26480.226696962
41692.91780.339051718173
51590.52960.453391115112
61490.31240.463781219122
71388.24310.5628521422
81288.24310.562855852
91185.97440.6714661063
101083.06390.8108071373
11983.06390.810801312
12881.40390.8902721725
13779.81850.9661761165
14678.75341.0171641243
15566.21121.617602527
16462.00361.819041617
17341.04742.8222914110
18240.17182.8642127210
1910.00004.7873912120

최종 분할

관측치 수군집 내 제곱합중심으로부터 평균 거리중심으로부터 최대 거리
군집120761.913232.53613