K-평균 군집에 대한 모든 통계량 및 그래프 해석

K-평균 군집 분석과 함께 제공되는 모든 통계 및 그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

관측치 수

최종 분할에 있는 각 군집의 관측치 수입니다.

해석

평균 거리, 군집 내 제곱합 등 변동성의 측도를 해석할 때 각 군집의 관측치 수를 조사합니다. 관측치 수를 줄이거나 늘릴 경우 군집의 변동성이 영향을 받을 수도 있습니다. 예를 들어, 관측치를 추가하면 군집 내 제곱합이 증가합니다.

다른 군집보다 관측치 수가 유의하게 적은 군집을 조사합니다. 관측치 수가 매우 적은 군집에는 특이치나 고유한 특성을 가진 비정상적인 관측치가 포함될 수도 있습니다.

군집 내 제곱합

각 관측치의 군집 중심으로부터의 편차 제곱 합입니다.

해석

군집 내 제곱합은 각 군집 내 관측치의 변동성 측도입니다. 일반적으로 제곱합이 작은 군집은 제곱합이 큰 군집보다 크기가 작습니다. 값이 더 클수록 군집 내 관측치의 변동성이 더 크다는 것을 나타냅니다.

그러나 분산 분석의 제곱합 및 평균 제곱과 마찬가지로 군집 내 제곱합은 관측치 수의 영향을 받습니다. 관측치 수가 증가하면 제곱합이 증가합니다. 따라서 군집 내 제곱합은 일반적으로 관측치 수가 다른 군집 간에 직접 비교할 수 없습니다. 여러 군집의 군집 내 변동성을 비교하려면 중심으로부터의 평균 거리를 대신 사용하십시오.

중심으로부터 평균 거리

관측치에서 각 군집 중심까지의 평균 거리입니다.

해석

관측치에서 군집 중심까지의 평균 거리는 각 군집 내 관측치의 변동성 측도입니다. 일반적으로 평균 거리가 더 작은 군집은 평균 거리가 더 큰 군집보다 크기가 작습니다. 값이 더 클수록 군집 내 관측치의 변동성이 더 크다는 것을 나타냅니다.

중심으로부터 최대 거리

관측치에서 각 군집 중심까지의 최대 거리입니다.

해석

관측치에서 군집 중심까지의 최대 거리는 각 군집 내 관측치의 변동성 측도입니다. 최대값이 클수록, 특히 평균과 비교하여 군집의 관측치가 군집 중심에서 더 멀리 떨어져 있다는 것을 나타냅니다.

군집 중심

군집 중심은 군집의 가운데입니다. 중심은 각 변수에 대해 하나의 숫자를 포함하는 벡터로, 각 숫자는 해당 군집 내 관측치에 대한 변수의 평균입니다. 중심은 군집의 다차원 평균이라고 생각할 수 있습니다.

해석

군집 중심을 군집 위치의 일반적인 측도로 사용할 수 있으며 군집 중심을 사용하면 각 군집을 해석할 수 있습니다. 각 중심은 분석의 모든 변수에서 한 군집 내 "평균 관측치"를 나타내는 것으로 간주할 수 있습니다.

Minitab에서는 최종 분할에 포함된 군집의 중심 간 거리를 계산합니다. Minitab에서는 또한 각 군집에 대해 군집 중심과 군집 내 관측치 간의 다양한 거리 측도를 계산합니다. 자세한 내용은 각 거리 측도에 대한 항목을 참조하십시오.

총 중심

총 중심은 모든 관측 개체에 대한 변수 평균의 벡터입니다.

군집 중심 간 거리

군집 중심 간 거리는 최종 분할에서 군집의 중심이 서로 얼마나 떨어져 있는지 측정합니다.

해석

거리 값은 그 자체로는 별로 유용하지 않지만 거리를 비교하여 군집의 서로 다른 정도를 알아볼 수 있습니다. 거리가 클수록 일반적으로 군집 간의 차이가 크다는 것을 나타냅니다.