En cada paso del proceso de amalgamación, vea los conglomerados formados y examine sus niveles de similitud y distancia. Cuanto mayor sea el nivel de similitud, más similares (correlacionadas) serán las variables en cada conglomerado. Cuanto menor sea el nivel de distancia, más cerca estarán las variables en cada conglomerado.
Lo ideal sería que los conglomerados tuvieran un nivel de similitud relativamente alto y un nivel de distancia relativamente bajo. Sin embargo, esa meta se debe equilibrar con tener un número razonable y práctico de conglomerados.
Paso | Número de conglomerados | Nivel de semejanzal | Nivel de distancia | Conglomerados incorporados | Nuevo conglomerado | Número de obs. en el conglomerado nuevo | |
---|---|---|---|---|---|---|---|
1 | 4 | 93.9666 | 0.120669 | 2 | 3 | 2 | 2 |
2 | 3 | 93.1548 | 0.136904 | 4 | 5 | 4 | 2 |
3 | 2 | 87.3150 | 0.253700 | 1 | 4 | 1 | 3 |
4 | 1 | 79.8113 | 0.403775 | 1 | 2 | 1 | 5 |
En estos resultados, los datos contienen un total de 5 variables. En el paso 1, dos conglomerados (las variables 2 y 3 de la hoja de trabajo) se unen para formar un nuevo conglomerado. Esto crea 4 conglomerados en los datos, con un nivel de similitud de 93.9666 y un nivel de distancia de 0.130669. Aunque el nivel de similitud es alto y el nivel de distancia es bajo, el número de conglomerados es demasiado alto como para ser útil. En cada paso posterior, a medida que se forman nuevos conglomerados, el nivel de similitud disminuye y el nivel de distancia aumenta. En el paso final, todas las variables se unen en un único conglomerado.
Para ver los niveles de similitud en el dendrograma, coloque el puntero del ratón sobre una línea horizontal en el diagrama de árbol, en Minitab.
Utilice el nivel de similitud de los conglomerados que se unen en cada paso como ayuda para determinar las agrupaciones finales para los datos.Busque un cambio abrupto en el nivel de similitud entre los pasos. El paso que precede al cambio abrupto en la similitud puede representar un punto de corte adecuado para la partición final. Para la partición final, los conglomerados deben tener un nivel de similitud razonablemente alto. También debería utilizar su conocimiento práctico de los datos para determinar las agrupaciones finales que tienen más sentido para su aplicación.
Por ejemplo, la siguiente tabla de amalgamación muestra que el nivel de similitud aumenta ligeramente del paso 1 (93.9666) al paso 2 (93.1548). Luego la similitud disminuye abruptamente en el paso 3 (87.3150), cuando el número de conglomerados cambia de 3 a 2. Estos resultados indican que 3 conglomerados pueden ser apropiados para la partición final. Si esta agrupación tiene sentido intuitivo, entonces es probable que sea una elección adecuada.
Paso | Número de conglomerados | Nivel de semejanzal | Nivel de distancia | Conglomerados incorporados | Nuevo conglomerado | Número de obs. en el conglomerado nuevo | |
---|---|---|---|---|---|---|---|
1 | 4 | 93.9666 | 0.120669 | 2 | 3 | 2 | 2 |
2 | 3 | 93.1548 | 0.136904 | 4 | 5 | 4 | 2 |
3 | 2 | 87.3150 | 0.253700 | 1 | 4 | 1 | 3 |
4 | 1 | 79.8113 | 0.403775 | 1 | 2 | 1 | 5 |
La decisión acerca de la agrupación final también se conoce como cortar el dendrograma. Cortar el dendrograma es similar a trazar una línea horizontal a lo largo del dendrograma para especificar la agrupación final. Por ejemplo, para cortar este dendrograma en cuatro conglomerados, imagine trazar una línea horizontal alrededor de la mitad del eje vertical, justo por debajo del nivel de similitud de aproximadamente 88.
Después de determinar las agrupaciones finales en el paso 2, repita el análisis y especifique el número de conglomerados (o el nivel de similitud) de la partición final. Minitab muestra la tabla de la partición final, que muestra las variables que forman cada conglomerado incluido en la partición final.
Examine los conglomerados incluidos en la partición final para determinar si la agrupación parece lógica para la aplicación específica. Si aún no está seguro, puede repetir el análisis y comparar diferentes agrupaciones finales en los dendrogramas para determinar cuál de ellas es la más lógica para los datos.
Paso | Número de conglomerados | Nivel de semejanzal | Nivel de distancia | Conglomerados incorporados | Nuevo conglomerado | Número de obs. en el conglomerado nuevo | |
---|---|---|---|---|---|---|---|
1 | 4 | 93.9666 | 0.120669 | 2 | 3 | 2 | 2 |
2 | 3 | 93.1548 | 0.136904 | 4 | 5 | 4 | 2 |
3 | 2 | 87.3150 | 0.253700 | 1 | 4 | 1 | 3 |
4 | 1 | 79.8113 | 0.403775 | 1 | 2 | 1 | 5 |
Variables | |
---|---|
Conglomerado 1 | Periódico |
Conglomerado 2 | Radios Televisores |
Conglomerado 3 | Alfabetismo Universidad |
En estos resultados, los tres conglomerados se forman en la partición final:
Este dendrograma se creó usando una partición final de 3 conglomerados. Cada conglomerado final se indica con un color diferente. El dendrograma se cortó a un nivel de similitud de aproximadamente 88. Si el dendrograma se cortara más arriba, entonces habría menos conglomerados finales, pero el nivel de similitud se reduciría. Si el dendrograma se cortara más abajo, entonces el nivel de similitud sería mayor, pero habría más conglomerados finales.