Interpretar los resultados clave para Conglomerados de k-medias

Complete los siguientes pasos para interpretar un análisis de conglomerado de k-medias. La salida clave incluye las observaciones y las medidas de variabilidad de los conglomerados incluidos en la partición final.

Paso 1: Examinar las agrupaciones finales

Examine las agrupaciones finales para ver si los conglomerados de la partición final tienen sentido intuitivo, con base en la partición inicial que se especificó. Verifique que el número de observaciones en cada conglomerado satisfaga los objetivos de agrupación. Si un conglomerado contiene muy pocas o demasiadas observaciones, se debería volver a ejecutar el análisis utilizando otra partición inicial.

Método

Número de conglomerados3
Variables estandarizadas

Partición final

Número de
observaciones
Dentro de la
suma de
cuadrados del
conglomerado
Distancia
promedio
desde el
centroide
Distancia
máxima desde
centroide
         
Conglomerado141.5930.5780.884
Conglomerado288.7360.9641.656
Conglomerado31012.9211.0931.463

Centroides de grupo

VariableConglomerado1Conglomerado2Conglomerado3Centroide
principal
         
Clientes1.23180.5225-0.91080.0000
Tasa Retorno1.29420.2217-0.69500.0000
Ventas1.18660.5157-0.88720.0000
Años1.20300.5479-0.91950.0000

Las distancias entre los centroides de conglomerados

Conglomerado1Conglomerado2Conglomerado3
       
Conglomerado10.00001.59154.1658
Conglomerado21.59150.00002.6488
Conglomerado34.16582.64880.0000
Resultados clave: Partición final

En estos resultados, Minitab agrupa los datos de 22 empresas en 3 conglomerados con base en la partición inicial que se especificó. El Conglomerado 1 contiene 4 observaciones y representa a empresas grandes ya establecidas. El Conglomerado 2 contiene 8 observaciones y representa a empresas de mediano crecimiento. El Conglomerado 3 contiene 10 observaciones y representa a empresas creadas recientemente. Un analista de negocios cree que estas agrupaciones finales son adecuadas para los datos.

Nota

Para ver a qué conglomerado pertenece cada observación, debe ingresar una columna de almacenamiento al realizar el análisis. Minitab almacena a qué conglomerado pertenece cada observación en una columna de la hoja de trabajo.

Paso 2: Evaluar la variabilidad dentro de cada conglomerado

Examine la variabilidad de las observaciones dentro de cada conglomerado utilizando las medidas de distancia desde el centroide. Los conglomerados con valores más altos muestran una mayor variabilidad de las observaciones dentro del conglomerado. Si la diferencia de la variabilidad entre los conglomerados es demasiado alta, se debería volver a ejecutar el análisis utilizando otra partición inicial.

Método

Número de conglomerados3
Variables estandarizadas

Partición final

Número de
observaciones
Dentro de la
suma de
cuadrados del
conglomerado
Distancia
promedio
desde el
centroide
Distancia
máxima desde
centroide
         
Conglomerado141.5930.5780.884
Conglomerado288.7360.9641.656
Conglomerado31012.9211.0931.463

Centroides de grupo

VariableConglomerado1Conglomerado2Conglomerado3Centroide
principal
         
Clientes1.23180.5225-0.91080.0000
Tasa Retorno1.29420.2217-0.69500.0000
Ventas1.18660.5157-0.88720.0000
Años1.20300.5479-0.91950.0000

Las distancias entre los centroides de conglomerados

Conglomerado1Conglomerado2Conglomerado3
       
Conglomerado10.00001.59154.1658
Conglomerado21.59150.00002.6488
Conglomerado34.16582.64880.0000
Resultados clave: Distancia promedio desde el centroide

En estos resultados, la distancia promedio desde el centroide más baja es la del Conglomerado 1 (0.578) y la más alta es la del Conglomerado 3 (1.093). Esto indica que el Conglomerado 1 tiene la menor variabilidad y Conglomerado 3 tiene la mayor variabilidad. Sin embargo, el Conglomerado 1 tiene la menor cantidad de observaciones (4) y el Conglomerado 3 tiene el mayor número de observaciones (10), lo cual pudiera explicar en parte la diferencia en la variabilidad.