Interpretar los resultados clave para Conglomerados de variables

Complete los siguientes pasos para interpretar un análisis de conglomerado de variables. La salida clave incluye los valores de similitud y distancia, el dendrograma y la partición final.

Paso 1: Examinar los niveles de similitud y de distancia

En cada paso del proceso de amalgamación, vea los conglomerados formados y examine sus niveles de similitud y distancia. Cuanto mayor sea el nivel de similitud, más similares (correlacionadas) serán las variables en cada conglomerado. Cuanto menor sea el nivel de distancia, más cerca estarán las variables en cada conglomerado.

Lo ideal sería que los conglomerados tuvieran un nivel de similitud relativamente alto y un nivel de distancia relativamente bajo. Sin embargo, esa meta se debe equilibrar con tener un número razonable y práctico de conglomerados.

Distancia de coeficiente de correlación, Enlace de promedios

Pasos de amalgamación

PasoNúmero de
conglomerados
Nivel de
semejanzal
Nivel de
distancia
Conglomerados
incorporados
Nuevo
conglomerado
Número de obs. en
el conglomerado
nuevo
1493.96660.1206692322
2393.15480.1369044542
3287.31500.2537001413
4179.81130.4037751215
Resultados clave: Nivel similitud, nivel de distancia

En estos resultados, los datos contienen un total de 5 variables. En el paso 1, dos conglomerados (las variables 2 y 3 de la hoja de trabajo) se unen para formar un nuevo conglomerado. Esto crea 4 conglomerados en los datos, con un nivel de similitud de 93.9666 y un nivel de distancia de 0.130669. Aunque el nivel de similitud es alto y el nivel de distancia es bajo, el número de conglomerados es demasiado alto como para ser útil. En cada paso posterior, a medida que se forman nuevos conglomerados, el nivel de similitud disminuye y el nivel de distancia aumenta. En el paso final, todas las variables se unen en un único conglomerado.

Para ver los niveles de similitud en el dendrograma, coloque el puntero del ratón sobre una línea horizontal en el diagrama de árbol, en Minitab.

Paso 2: Determinar las agrupaciones finales para los datos

Utilice el nivel de similitud de los conglomerados que se unen en cada paso como ayuda para determinar las agrupaciones finales para los datos.Busque un cambio abrupto en el nivel de similitud entre los pasos. El paso que precede al cambio abrupto en la similitud puede representar un punto de corte adecuado para la partición final. Para la partición final, los conglomerados deben tener un nivel de similitud razonablemente alto. También debería utilizar su conocimiento práctico de los datos para determinar las agrupaciones finales que tienen más sentido para su aplicación.

Por ejemplo, la siguiente tabla de amalgamación muestra que el nivel de similitud aumenta ligeramente del paso 1 (93.9666) al paso 2 (93.1548). Luego la similitud disminuye abruptamente en el paso 3 (87.3150), cuando el número de conglomerados cambia de 3 a 2. Estos resultados indican que 3 conglomerados pueden ser apropiados para la partición final. Si esta agrupación tiene sentido intuitivo, entonces es probable que sea una elección adecuada.

Distancia de coeficiente de correlación, Enlace de promedios

Pasos de amalgamación

PasoNúmero de
conglomerados
Nivel de
semejanzal
Nivel de
distancia
Conglomerados
incorporados
Nuevo
conglomerado
Número de obs. en
el conglomerado
nuevo
1493.96660.1206692322
2393.15480.1369044542
3287.31500.2537001413
4179.81130.4037751215
Resultados clave: Nivel de similitud, número de conglomerados

La decisión acerca de la agrupación final también se conoce como cortar el dendrograma. Cortar el dendrograma es similar a trazar una línea horizontal a lo largo del dendrograma para especificar la agrupación final. Por ejemplo, para cortar este dendrograma en cuatro conglomerados, imagine trazar una línea horizontal alrededor de la mitad del eje vertical, justo por debajo del nivel de similitud de aproximadamente 88.

Paso 3: Examinar la partición final

Después de determinar las agrupaciones finales en el paso 2, repita el análisis y especifique el número de conglomerados (o el nivel de similitud) de la partición final. Minitab muestra la tabla de la partición final, que muestra las variables que forman cada conglomerado incluido en la partición final.

Examine los conglomerados incluidos en la partición final para determinar si la agrupación parece lógica para la aplicación específica. Si aún no está seguro, puede repetir el análisis y comparar diferentes agrupaciones finales en los dendrogramas para determinar cuál de ellas es la más lógica para los datos.

Distancia de coeficiente de correlación, Enlace de promedios

Pasos de amalgamación

PasoNúmero de
conglomerados
Nivel de
semejanzal
Nivel de
distancia
Conglomerados
incorporados
Nuevo
conglomerado
Número de obs. en
el conglomerado
nuevo
1493.96660.1206692322
2393.15480.1369044542
3287.31500.2537001413
4179.81130.4037751215

Partición final

Variables
Conglomerado 1  Periódico
Conglomerado 2  Radios  Televisores
Conglomerado 3  Alfabetismo  Universidad
Resultados clave: Partición final, dendrograma

En estos resultados, los tres conglomerados se forman en la partición final:

  • Número de ejemplares de periódicos por cada 1,000 personas
  • Número de aparatos de radio y televisión
  • Nivel de alfabetización y presencia de una universidad en la ciudad
Esta agrupación parece razonable.

Este dendrograma se creó usando una partición final de 3 conglomerados. Cada conglomerado final se indica con un color diferente. El dendrograma se cortó a un nivel de similitud de aproximadamente 88. Si el dendrograma se cortara más arriba, entonces habría menos conglomerados finales, pero el nivel de similitud se reduciría. Si el dendrograma se cortara más abajo, entonces el nivel de similitud sería mayor, pero habría más conglomerados finales.