변수 군집에 대한 데이터 고려사항

유효한 결과를 얻으려면 데이터를 수집하고 분석을 수행하거나 결과를 해석할 때 다음 지침을 따르십시오.

원시 데이터 또는 거리 행렬이 있어야 함

일반적으로 이 분석에서는 원시 데이터를 사용합니다. 각 행에는 하나의 항목 또는 개체에 대한 측정값이 있습니다. 또한 서로 다른 측정값을 나타내는 숫자 열이 둘 이상 있어야 합니다. 이 분석을 사용하려면 먼저 워크시트에서 결측 데이터가 있는 행을 삭제해야 합니다.

p x p 거리 행렬을 저장하는 경우(여기서 P는 변수의 수임) 행렬을 분석에 사용할 수 있습니다. 행렬의 (i, j) 항목은 변수 i와 j 간의 거리입니다. 설계 행렬을 사용하는 경우에는 Minitab에서 최종 분할에 대한 통계량을 계산할 수 없습니다.

데이터가 숫자여야 함
군집을 형성하기 위해 이 분석에서는 범주형 변수의 수준 간에 측정할 수 없는 변수 사이의 거리를 계산합니다. 분석에서 범주형 변수를 사용하려면 먼저 텍스트 값을 숫자 척도로 변환해야 합니다. 예를 들어, 한 분석가가 "매우 만족", "만족", "불만족", "매우 불만족" 범주를 사용하여 고객 만족도를 측정합니다. 변수 군집 분석을 수행하기 위해 분석가는 이 범주들을 +2, +1 , −1, −2로 다시 코드화합니다. 이제 분석을 위해 두 변수 사이의 거리를 계산할 수 있습니다. 또는 워크시트를 범주형 변수의 각 수준에 대해 별도의 워크시트로 분할하고 각 수준에서 변수를 군집으로 나눌 수 있습니다. 워크시트 분할에 대한 자세한 내용은 워크시트 분할에 대한 개요에서 확인하십시오.