Determinar la agrupación final de conglomerados

La agrupación final de conglomerados (también denominada partición final) es la agrupación de conglomerados que se espera que identifique los grupos cuyas observaciones o variables comparten características comunes. La decisión acerca de la agrupación final también se conoce como cortar el dendrograma. El dendrograma completo (diagrama de árbol) es una representación gráfica de la amalgamación de las observaciones o variables en un solo conglomerado. Cortar el dendrograma es similar a trazar una línea a lo largo del dendrograma para especificar la agrupación final. Los pasos siguientes pueden ayudarle a determinar dónde cortar el dendrograma.

  1. Realice un análisis de conglomerados utilizando el valor predeterminado (1 conglomerado en la partición final). Minitab muestra los resultados para todos los números posibles de conglomerados.
  2. Examine los niveles de similitud y de distancia en la salida tabular y en el dendrograma. Para ver los niveles de similitud, coloque el puntero del ratón sobre una línea horizontal del dendrograma. El nivel de similitud en cualquier paso es el porcentaje de la distancia mínima en ese paso en relación con la distancia máxima entre observaciones en los datos.
  3. Elija dónde desea hacer la partición final. El patrón de cómo cambian los valores de similitud o de distancia entre un paso y otro puede ayudarle a elegir la agrupación final. El paso donde los valores cambian repentinamente podría identificar un punto adecuado para cortar el dendrograma, si esto es lógico para sus datos.
  4. Vuelva a ejecutar el procedimiento de creación de conglomerados, utilizando bien sea el Número de conglomerados o el Nivel de similitud para obtener un número establecido de grupos o un nivel de similitud para cortar el dendrograma.
  5. Examine los conglomerados resultantes en la partición final para determinar si la agrupación parece lógica. Examinar diferentes agrupaciones finales en los dendrogramas también puede ayudarle a decidir cuál de ellas es la más lógica para los datos.
Nota

Para algunos conjuntos de datos, los métodos de promedios, centroides, medianas y de Ward podrían no producir un dendrograma jerárquico. Es decir, la distancias de amalgamación no siempre aumentan con cada paso. En el dendrograma, un paso de ese tipo producirá una unión que va hacia abajo en vez de ir hacia arriba.