K-평균 군집에 대한 주요 결과 해석

K-평균 군집 분석을 해석하려면 다음 단계를 수행하십시오. 주요 결과에는 최종 분할의 군집에 대한 관측치 및 변동성 측도가 포함됩니다.

1단계: 최종 그룹 조사

지정된 초기 분할을 기반으로 최종 분할의 군집이 직관적인 의미가 있는지 여부를 확인하려면 최종 그룹을 조사합니다. 각 군집의 관측치 수가 그룹화 목표를 충족하는지 확인합니다. 한 군집의 관측치 수가 너무 작거나 너무 많으면 다른 초기 분할을 사용하여 분석을 다시 실행할 수 있습니다.

방법

군집 수3
표준화 변수

최종 분할

관측치 수군집 내 제곱합중심으로부터 평균 거리중심으로부터 최대 거리
         
군집141.5930.5780.884
군집288.7360.9641.656
군집31012.9211.0931.463

군집 중심

변수군집1군집2군집3총 중심
         
고객1.23180.5225-0.91080.0000
수익률1.29420.2217-0.69500.0000
매출액1.18660.5157-0.88720.0000
기간(년)1.20300.5479-0.91950.0000

군집 중심 간 거리

군집1군집2군집3
       
군집10.00001.59154.1658
군집21.59150.00002.6488
군집34.16582.64880.0000
주요 결과: 최종 분할

이 결과에서 Minitab에서는 지정된 초기 분할을 기반으로 22개 회사에 대한 데이터를 3개의 군집으로 나눕니다. 군집 1은 4개의 관측치를 포함하며 대규모의 기성 업체를 나타냅니다. 군집 2는 8개의 관측치를 포함하며 중간 성장 업체를 나타냅니다. 군집 3은 10개의 관측치를 포함하며 신생 업체를 나타냅니다. 한 비즈니스 분석가는 이러한 최종 그룹이 데이터에 적합하다고 생각합니다.

참고

각 관측치가 어느 군집에 속하는지 확인하려면 분석을 수행할 때 저장 열을 입력해야 합니다. Minitab에서는 각 관측치의 소속 군집을 워크시트의 열에 저장합니다.

2단계: 각 군집 내 변동성 평가

중심 측도로부터의 거리를 사용하여 각 군집 내 관측치의 변동성을 조사합니다. 값이 더 클수록 군집 내 관측치의 변동성이 더 크다는 것을 나타냅니다. 군집 간 변동성의 차이가 너무 크면 다른 초기 분할을 사용하여 분석을 다시 실행할 수 있습니다.

방법

군집 수3
표준화 변수

최종 분할

관측치 수군집 내 제곱합중심으로부터 평균 거리중심으로부터 최대 거리
         
군집141.5930.5780.884
군집288.7360.9641.656
군집31012.9211.0931.463

군집 중심

변수군집1군집2군집3총 중심
         
고객1.23180.5225-0.91080.0000
수익률1.29420.2217-0.69500.0000
매출액1.18660.5157-0.88720.0000
기간(년)1.20300.5479-0.91950.0000

군집 중심 간 거리

군집1군집2군집3
       
군집10.00001.59154.1658
군집21.59150.00002.6488
군집34.16582.64880.0000
주요 결과: 중심으로부터 평균 거리

이 결과에서 중심으로부터 평균 거리는 군집 1의 경우 가장 작고(0.578) 군집 3의 경우 가장 큽니다(1.093). 이는 군집 1의 변동성이 가장 작고 군집 3의 변동성이 가장 크다는 것을 나타냅니다. 그러나 군집 1의 관측치 수가 가장 적고(4) 군집 3의 관측치 수가 가장 많으며(10), 이러한 사실이 변동성의 차이를 부분적으로 설명할 수도 있습니다.