Pasos de la amalgamación

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos que se proporcionan en los resultados con respecto a los pasos de la amalgamación.

Paso

El número del paso en el procedimiento de amalgamación para unir los conglomerados. En cada paso, un nuevo conglomerado se une a un conglomerado existente y se calcula el nivel de similitud y el nivel de distancia.

Número de conglomerados

El número de conglomerados que se forman en cada paso del proceso de amalgamación. Antes del primer paso, el número de conglomerados es igual al número total de observaciones (para los conglomerados de observaciones) o el número total de variables (para los conglomerados de variables). En el primer paso, dos conglomerados se unen para formar un nuevo conglomerado. En cada paso subsiguiente, otro conglomerado se une a un conglomerado existente para formar un nuevo conglomerado. En el paso final, todas las observaciones o variables se combinan en un único conglomerado.

Puede ingresar el número de conglomerados en el cuadro de diálogo principal para especificar la partición final de los datos. El método de enlace y la medida de distancia que usted elija influirá notablemente en el resultado de la formación de conglomerados.

Nivel de similitud

El porcentaje de la distancia mínima entre los conglomerados en cada paso de amalgamación con respecto a la distancia máxima entre las observaciones en los datos. La similitud, s(ij), entre dos conglomerados i y j viene dada por s(ij) = 100* [1 - d(ij) / d (máx)], donde d(máx) es el valor máximo en la matriz de distancia original, D, con la entrada d(ij) para la distancia entre i y j.

Interpretación

Utilice el nivel de similitud de los conglomerados que se unen en cada paso como ayuda para determinar las agrupaciones finales para los datos.Busque un cambio abrupto en el nivel de similitud entre los pasos. El paso que precede al cambio abrupto en la similitud puede representar un punto de corte adecuado para la partición final. Para la partición final, los conglomerados deben tener un nivel de similitud razonablemente alto. También debería utilizar su conocimiento práctico de los datos para determinar las agrupaciones finales que tienen más sentido para su aplicación.

Por ejemplo, la siguiente tabla de amalgamación muestra que el nivel de similitud disminuye en incrementos de aproximadamente 3 o menos hasta el paso 15. La similitud disminuye en más de 20 (de 62.0036 a 41.0474) en los pasos 16 y 17, cuando el número de conglomerados cambia de 4 a 3. Estos resultados indican que 4 conglomerados pueden ser suficientes para la partición final. Si esta agrupación tiene sentido intuitivo, entonces es probable que sea una elección adecuada.

Pasos de amalgamación

PasoNúmero de
conglomerados
Nivel de
semejanzal
Nivel de
distancia
Conglomerados
incorporados
Nuevo
conglomerado
Número de obs. en
el conglomerado
nuevo
11996.60050.162751316132
21895.46420.217151720172
31795.26480.226696962
41692.91780.339051718173
51590.52960.453391115112
61490.31240.463781219122
71388.24310.5628521422
81288.24310.562855852
91185.97440.6714661063
101083.06390.8108071373
11983.06390.810801312
12881.40390.8902721725
13779.81850.9661761165
14678.75341.0171641243
15566.21121.617602527
16462.00361.819041617
17341.04742.8222914110
18240.17182.8642127210
1910.00004.7873912120
Sugerencia

Para evaluar visualmente los niveles de similitud en cada paso, utilice el dendrograma.

Nivel de distancia

La distancia entre los conglomerados (utilizando el método de enlace elegido) o las variables (utilizando la medida de distancia elegida) que se unen en cada paso. Minitab calcula el nivel de distancia con base en el método y la medida de distancia que usted seleccione en el cuadro de diálogo principal.

Interpretación

Utilice el nivel de distancia de los conglomerados que se unen en cada paso como ayuda para determinar las agrupaciones finales para los datos. Busque un cambio abrupto en el nivel de distancia entre los pasos. El paso que precede al cambio abrupto en la distancia puede representar un punto de corte adecuado para la partición final. Para la partición final, los conglomerados deben tener un nivel de distancia razonablemente pequeño. También debería utilizar su conocimiento práctico de los datos para determinar las agrupaciones finales que tienen más sentido para su aplicación.

Por ejemplo, la siguiente tabla de amalgamación muestra que el nivel de distancia aumenta en aproximadamente 0.6 o menos para los primeros 15 pasos. Sin embargo, en los pasos 16 y 17, cuando el número de conglomerados cambia de 4 a 3, el nivel de distancia aumenta en más de 1 (de 1.81904 a 2.82229). Estos resultados indican que 4 conglomerados pueden ser suficientes para la partición final. Si esta agrupación tiene sentido intuitivo, entonces es probable que sea una elección adecuada.

Pasos de amalgamación

PasoNúmero de
conglomerados
Nivel de
semejanzal
Nivel de
distancia
Conglomerados
incorporados
Nuevo
conglomerado
Número de obs. en
el conglomerado
nuevo
11996.60050.162751316132
21895.46420.217151720172
31795.26480.226696962
41692.91780.339051718173
51590.52960.453391115112
61490.31240.463781219122
71388.24310.5628521422
81288.24310.562855852
91185.97440.6714661063
101083.06390.8108071373
11983.06390.810801312
12881.40390.8902721725
13779.81850.9661761165
14678.75341.0171641243
15566.21121.617602527
16462.00361.819041617
17341.04742.8222914110
18240.17182.8642127210
1910.00004.7873912120

Conglomerados unidos

Los dos conglomerados que se unen para formar un nuevo conglomerado en cada paso del proceso de amalgamación.

Nuevo conglomerado

El número de identificación del nuevo conglomerado que se forma en cada paso del proceso de amalgamación. El número de identificación del nuevo conglomerado siempre es el más pequeño de los números de los dos conglomerados que se unen. Por ejemplo, si se unen el conglomerado 2 y el conglomerado 9, entonces el nuevo conglomerado que se forma se llama conglomerado 2.

Número de observaciones en el nuevo conglomerado

El número de observaciones de cada nuevo conglomerado que se forma en cada paso del proceso de amalgamación. En el paso final, todas las observaciones se combinan en un único conglomerado. Por lo tanto, el número de observaciones del nuevo conglomerado formado en el último paso es igual al número total de observaciones en los datos.

Nota

Para Conglomerados de variables, el número de observaciones es el número de variables del nuevo conglomerado.