El número del paso en el procedimiento de amalgamación para unir los conglomerados. En cada paso, un nuevo conglomerado se une a un conglomerado existente y se calcula el nivel de similitud y el nivel de distancia.
El número de conglomerados que se forman en cada paso del proceso de amalgamación. Antes del primer paso, el número de conglomerados es igual al número total de observaciones (para los conglomerados de observaciones) o el número total de variables (para los conglomerados de variables). En el primer paso, dos conglomerados se unen para formar un nuevo conglomerado. En cada paso subsiguiente, otro conglomerado se une a un conglomerado existente para formar un nuevo conglomerado. En el paso final, todas las observaciones o variables se combinan en un único conglomerado.
Puede ingresar el número de conglomerados en el cuadro de diálogo principal para especificar la partición final de los datos. El método de enlace y la medida de distancia que usted elija influirá notablemente en el resultado de la formación de conglomerados.
El porcentaje de la distancia mínima entre los conglomerados en cada paso de amalgamación con respecto a la distancia máxima entre las observaciones en los datos. La similitud, s(ij), entre dos conglomerados i y j viene dada por s(ij) = 100* [1 - d(ij) / d (máx)], donde d(máx) es el valor máximo en la matriz de distancia original, D, con la entrada d(ij) para la distancia entre i y j.
Utilice el nivel de similitud de los conglomerados que se unen en cada paso como ayuda para determinar las agrupaciones finales para los datos.Busque un cambio abrupto en el nivel de similitud entre los pasos. El paso que precede al cambio abrupto en la similitud puede representar un punto de corte adecuado para la partición final. Para la partición final, los conglomerados deben tener un nivel de similitud razonablemente alto. También debería utilizar su conocimiento práctico de los datos para determinar las agrupaciones finales que tienen más sentido para su aplicación.
Por ejemplo, la siguiente tabla de amalgamación muestra que el nivel de similitud disminuye en incrementos de aproximadamente 3 o menos hasta el paso 15. La similitud disminuye en más de 20 (de 62.0036 a 41.0474) en los pasos 16 y 17, cuando el número de conglomerados cambia de 4 a 3. Estos resultados indican que 4 conglomerados pueden ser suficientes para la partición final. Si esta agrupación tiene sentido intuitivo, entonces es probable que sea una elección adecuada.
Paso | Número de conglomerados | Nivel de semejanzal | Nivel de distancia | Conglomerados incorporados | Nuevo conglomerado | Número de obs. en el conglomerado nuevo | |
---|---|---|---|---|---|---|---|
1 | 19 | 96.6005 | 0.16275 | 13 | 16 | 13 | 2 |
2 | 18 | 95.4642 | 0.21715 | 17 | 20 | 17 | 2 |
3 | 17 | 95.2648 | 0.22669 | 6 | 9 | 6 | 2 |
4 | 16 | 92.9178 | 0.33905 | 17 | 18 | 17 | 3 |
5 | 15 | 90.5296 | 0.45339 | 11 | 15 | 11 | 2 |
6 | 14 | 90.3124 | 0.46378 | 12 | 19 | 12 | 2 |
7 | 13 | 88.2431 | 0.56285 | 2 | 14 | 2 | 2 |
8 | 12 | 88.2431 | 0.56285 | 5 | 8 | 5 | 2 |
9 | 11 | 85.9744 | 0.67146 | 6 | 10 | 6 | 3 |
10 | 10 | 83.0639 | 0.81080 | 7 | 13 | 7 | 3 |
11 | 9 | 83.0639 | 0.81080 | 1 | 3 | 1 | 2 |
12 | 8 | 81.4039 | 0.89027 | 2 | 17 | 2 | 5 |
13 | 7 | 79.8185 | 0.96617 | 6 | 11 | 6 | 5 |
14 | 6 | 78.7534 | 1.01716 | 4 | 12 | 4 | 3 |
15 | 5 | 66.2112 | 1.61760 | 2 | 5 | 2 | 7 |
16 | 4 | 62.0036 | 1.81904 | 1 | 6 | 1 | 7 |
17 | 3 | 41.0474 | 2.82229 | 1 | 4 | 1 | 10 |
18 | 2 | 40.1718 | 2.86421 | 2 | 7 | 2 | 10 |
19 | 1 | 0.0000 | 4.78739 | 1 | 2 | 1 | 20 |
Para evaluar visualmente los niveles de similitud en cada paso, utilice el dendrograma.
La distancia entre los conglomerados (utilizando el método de enlace elegido) o las variables (utilizando la medida de distancia elegida) que se unen en cada paso. Minitab calcula el nivel de distancia con base en el método y la medida de distancia que usted seleccione en el cuadro de diálogo principal.
Utilice el nivel de distancia de los conglomerados que se unen en cada paso como ayuda para determinar las agrupaciones finales para los datos. Busque un cambio abrupto en el nivel de distancia entre los pasos. El paso que precede al cambio abrupto en la distancia puede representar un punto de corte adecuado para la partición final. Para la partición final, los conglomerados deben tener un nivel de distancia razonablemente pequeño. También debería utilizar su conocimiento práctico de los datos para determinar las agrupaciones finales que tienen más sentido para su aplicación.
Por ejemplo, la siguiente tabla de amalgamación muestra que el nivel de distancia aumenta en aproximadamente 0.6 o menos para los primeros 15 pasos. Sin embargo, en los pasos 16 y 17, cuando el número de conglomerados cambia de 4 a 3, el nivel de distancia aumenta en más de 1 (de 1.81904 a 2.82229). Estos resultados indican que 4 conglomerados pueden ser suficientes para la partición final. Si esta agrupación tiene sentido intuitivo, entonces es probable que sea una elección adecuada.
Paso | Número de conglomerados | Nivel de semejanzal | Nivel de distancia | Conglomerados incorporados | Nuevo conglomerado | Número de obs. en el conglomerado nuevo | |
---|---|---|---|---|---|---|---|
1 | 19 | 96.6005 | 0.16275 | 13 | 16 | 13 | 2 |
2 | 18 | 95.4642 | 0.21715 | 17 | 20 | 17 | 2 |
3 | 17 | 95.2648 | 0.22669 | 6 | 9 | 6 | 2 |
4 | 16 | 92.9178 | 0.33905 | 17 | 18 | 17 | 3 |
5 | 15 | 90.5296 | 0.45339 | 11 | 15 | 11 | 2 |
6 | 14 | 90.3124 | 0.46378 | 12 | 19 | 12 | 2 |
7 | 13 | 88.2431 | 0.56285 | 2 | 14 | 2 | 2 |
8 | 12 | 88.2431 | 0.56285 | 5 | 8 | 5 | 2 |
9 | 11 | 85.9744 | 0.67146 | 6 | 10 | 6 | 3 |
10 | 10 | 83.0639 | 0.81080 | 7 | 13 | 7 | 3 |
11 | 9 | 83.0639 | 0.81080 | 1 | 3 | 1 | 2 |
12 | 8 | 81.4039 | 0.89027 | 2 | 17 | 2 | 5 |
13 | 7 | 79.8185 | 0.96617 | 6 | 11 | 6 | 5 |
14 | 6 | 78.7534 | 1.01716 | 4 | 12 | 4 | 3 |
15 | 5 | 66.2112 | 1.61760 | 2 | 5 | 2 | 7 |
16 | 4 | 62.0036 | 1.81904 | 1 | 6 | 1 | 7 |
17 | 3 | 41.0474 | 2.82229 | 1 | 4 | 1 | 10 |
18 | 2 | 40.1718 | 2.86421 | 2 | 7 | 2 | 10 |
19 | 1 | 0.0000 | 4.78739 | 1 | 2 | 1 | 20 |
Los dos conglomerados que se unen para formar un nuevo conglomerado en cada paso del proceso de amalgamación.
El número de identificación del nuevo conglomerado que se forma en cada paso del proceso de amalgamación. El número de identificación del nuevo conglomerado siempre es el más pequeño de los números de los dos conglomerados que se unen. Por ejemplo, si se unen el conglomerado 2 y el conglomerado 9, entonces el nuevo conglomerado que se forma se llama conglomerado 2.
El número de observaciones de cada nuevo conglomerado que se forma en cada paso del proceso de amalgamación. En el paso final, todas las observaciones se combinan en un único conglomerado. Por lo tanto, el número de observaciones del nuevo conglomerado formado en el último paso es igual al número total de observaciones en los datos.
Para Conglomerados de variables, el número de observaciones es el número de variables del nuevo conglomerado.