K-평균 군집 분석에 대한 주요 결과 해석

K-평균 군집 분석을 해석하려면 다음 단계를 수행하십시오. 주요 결과에는 최종 분할의 군집에 대한 관측치 및 변동성 측도가 포함됩니다.

1단계: 최종 그룹 조사

지정된 초기 분할을 기반으로 최종 분할의 군집이 직관적인 의미가 있는지 여부를 확인하려면 최종 그룹을 조사합니다. 각 군집의 관측치 수가 그룹화 목표를 충족하는지 확인합니다. 한 군집의 관측치 수가 너무 작거나 너무 많으면 다른 초기 분할을 사용하여 분석을 다시 실행할 수 있습니다.

K-평균 군집 분석: 고객, 수익률, 매출액, 기간(년)

방법 군집 수 3 표준화 변수 예
최종 분할 관측치 군집 내 중심으로부터 중심으로부터 수 제곱합 평균 거리 최대 거리 군집1 4 1.593 0.578 0.884 군집2 8 8.736 0.964 1.656 군집3 10 12.921 1.093 1.463
군집 중심 변수 군집1 군집2 군집3 총 중심 고객 1.2318 0.5225 -0.9108 0.0000 수익률 1.2942 0.2217 -0.6950 0.0000 매출액 1.1866 0.5157 -0.8872 0.0000 기간(년) 1.2030 0.5479 -0.9195 0.0000
군집 중심 간 거리 군집1 군집2 군집3 군집1 0.0000 1.5915 4.1658 군집2 1.5915 0.0000 2.6488 군집3 4.1658 2.6488 0.0000
주요 결과: 최종 분할

이 결과에서 Minitab에서는 지정된 초기 분할을 기반으로 22개 회사에 대한 데이터를 3개의 군집으로 나눕니다. 군집 1은 4개의 관측치를 포함하며 대규모의 기성 업체를 나타냅니다. 군집 2는 8개의 관측치를 포함하며 중간 성장 업체를 나타냅니다. 군집 3은 10개의 관측치를 포함하며 신생 업체를 나타냅니다. 한 비즈니스 분석가는 이러한 최종 그룹이 데이터에 적합하다고 생각합니다.

참고

각 관측치가 어느 군집에 속하는지 확인하려면 분석을 수행할 때 저장 열을 입력해야 합니다. Minitab에서는 각 관측치의 소속 군집을 워크시트의 열에 저장합니다.

2단계: 각 군집 내 변동성 평가

중심 측도로부터의 거리를 사용하여 각 군집 내 관측치의 변동성을 조사합니다. 값이 더 클수록 군집 내 관측치의 변동성이 더 크다는 것을 나타냅니다. 군집 간 변동성의 차이가 너무 크면 다른 초기 분할을 사용하여 분석을 다시 실행할 수 있습니다.

K-평균 군집 분석: 고객, 수익률, 매출액, 기간(년)

방법 군집 수 3 표준화 변수 예
최종 분할 관측치 군집 내 중심으로부터 중심으로부터 수 제곱합 평균 거리 최대 거리 군집1 4 1.593 0.578 0.884 군집2 8 8.736 0.964 1.656 군집3 10 12.921 1.093 1.463
군집 중심 변수 군집1 군집2 군집3 총 중심 고객 1.2318 0.5225 -0.9108 0.0000 수익률 1.2942 0.2217 -0.6950 0.0000 매출액 1.1866 0.5157 -0.8872 0.0000 기간(년) 1.2030 0.5479 -0.9195 0.0000
군집 중심 간 거리 군집1 군집2 군집3 군집1 0.0000 1.5915 4.1658 군집2 1.5915 0.0000 2.6488 군집3 4.1658 2.6488 0.0000
주요 결과: 중심으로부터 평균 거리

이 결과에서 중심으로부터 평균 거리는 군집 1의 경우 가장 작고(0.578) 군집 3의 경우 가장 큽니다(1.093). 이는 군집 1의 변동성이 가장 작고 군집 3의 변동성이 가장 크다는 것을 나타냅니다. 그러나 군집 1의 관측치 수가 가장 적고(4) 군집 3의 관측치 수가 가장 많으며(10), 이러한 사실이 변동성의 차이를 부분적으로 설명할 수도 있습니다.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오