Pasos de la amalgamación

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos que se proporcionan en los resultados con respecto a los pasos de la amalgamación.

Paso

El número del paso en el procedimiento de amalgamación para unir los conglomerados. En cada paso, un nuevo conglomerado se une a un conglomerado existente y se calcula el nivel de similitud y el nivel de distancia.

Número de conglomerados

El número de conglomerados que se forman en cada paso del proceso de amalgamación. Antes del primer paso, el número de conglomerados es igual al número total de observaciones (para los conglomerados de observaciones) o el número total de variables (para los conglomerados de variables). En el primer paso, dos conglomerados se unen para formar un nuevo conglomerado. En cada paso subsiguiente, otro conglomerado se une a un conglomerado existente para formar un nuevo conglomerado. En el paso final, todas las observaciones o variables se combinan en un único conglomerado.

Puede ingresar el número de conglomerados en el cuadro de diálogo principal para especificar la partición final de los datos. El método de enlace y la medida de distancia que usted elija influirá notablemente en el resultado de la formación de conglomerados.

Nivel de similitud

El porcentaje de la distancia mínima entre los conglomerados en cada paso de amalgamación con respecto a la distancia máxima entre las observaciones en los datos. La similitud, s(ij), entre dos conglomerados i y j viene dada por s(ij) = 100* [1 - d(ij) / d (máx)], donde d(máx) es el valor máximo en la matriz de distancia original, D, con la entrada d(ij) para la distancia entre i y j.

Interpretación

Utilice el nivel de similitud de los conglomerados que se unen en cada paso como ayuda para determinar las agrupaciones finales para los datos. Busque un cambio abrupto en el nivel de similitud entre los pasos. El paso que precede al cambio abrupto en la similitud puede representar un punto de corte adecuado para la partición final. Para la partición final, los conglomerados deben tener un nivel de similitud razonablemente alto. También debería utilizar su conocimiento práctico de los datos para determinar las agrupaciones finales que tienen más sentido para su aplicación.

Por ejemplo, la siguiente tabla de amalgamación muestra que el nivel de similitud disminuye en incrementos de aproximadamente 3 o menos hasta el paso 15. La similitud disminuye en más de 20 (de 62.0036 a 41.0474) en los pasos 16 y 17, cuando el número de conglomerados cambia de 4 a 3. Estos resultados indican que 4 conglomerados pueden ser suficientes para la partición final. Si esta agrupación tiene sentido intuitivo, entonces es probable que sea una elección adecuada.

Pasos de amalgamación

Número de Nivel de Nivel de Conglomerados Nuevo Paso conglomerados semejanzal distancia incorporados conglomerado 1 19 96.6005 0.16275 13 16 13 2 18 95.4642 0.21715 17 20 17 3 17 95.2648 0.22669 6 9 6 4 16 92.9178 0.33905 17 18 17 5 15 90.5296 0.45339 11 15 11 6 14 90.3124 0.46378 12 19 12 7 13 88.2431 0.56285 5 8 5 8 12 88.2431 0.56285 2 14 2 9 11 85.9744 0.67146 6 10 6 10 10 83.0639 0.81080 7 13 7 11 9 83.0639 0.81080 1 3 1 12 8 81.4039 0.89027 2 17 2 13 7 79.8185 0.96617 6 11 6 14 6 78.7534 1.01716 4 12 4 15 5 66.2112 1.61760 2 5 2 16 4 62.0036 1.81904 1 6 1 17 3 41.0474 2.82229 1 4 1 18 2 40.1718 2.86421 2 7 2 19 1 0.0000 4.78739 1 2 1 Número de obs. en el conglomerado Paso nuevo 1 2 2 2 3 2 4 3 5 2 6 2 7 2 8 2 9 3 10 3 11 2 12 5 13 5 14 3 15 7 16 7 17 10 18 10 19 20
Partición final Dentro de la Distancia suma de promedio Distancia Número de cuadrados del desde el máxima desde observaciones conglomerado centroide centroide Conglomerado1 7 3.25713 0.612540 1.12081 Conglomerado2 7 2.72247 0.581390 0.95186 Conglomerado3 3 0.55977 0.398964 0.54907 Conglomerado4 3 0.37116 0.326533 0.48848
Sugerencia

Para evaluar visualmente los niveles de similitud en cada paso, utilice el dendrograma.

Nivel de distancia

La distancia entre los conglomerados (utilizando el método de enlace elegido) o las variables (utilizando la medida de distancia elegida) que se unen en cada paso. Minitab calcula el nivel de distancia con base en el método y la medida de distancia que usted seleccione en el cuadro de diálogo principal.

Interpretación

Utilice el nivel de distancia de los conglomerados que se unen en cada paso como ayuda para determinar las agrupaciones finales para los datos. Busque un cambio abrupto en el nivel de distancia entre los pasos. El paso que precede al cambio abrupto en la distancia puede representar un punto de corte adecuado para la partición final. Para la partición final, los conglomerados deben tener un nivel de distancia razonablemente pequeño. También debería utilizar su conocimiento práctico de los datos para determinar las agrupaciones finales que tienen más sentido para su aplicación.

Por ejemplo, la siguiente tabla de amalgamación muestra que el nivel de distancia aumenta en aproximadamente 0.6 o menos para los primeros 15 pasos. Sin embargo, en los pasos 16 y 17, cuando el número de conglomerados cambia de 4 a 3, el nivel de distancia aumenta en más de 1 (de 1.81904 a 2.82229). Estos resultados indican que 4 conglomerados pueden ser suficientes para la partición final. Si esta agrupación tiene sentido intuitivo, entonces es probable que sea una elección adecuada.

Pasos de amalgamación

Número de Nivel de Nivel de Conglomerados Nuevo Paso conglomerados semejanzal distancia incorporados conglomerado 1 19 96.6005 0.16275 13 16 13 2 18 95.4642 0.21715 17 20 17 3 17 95.2648 0.22669 6 9 6 4 16 92.9178 0.33905 17 18 17 5 15 90.5296 0.45339 11 15 11 6 14 90.3124 0.46378 12 19 12 7 13 88.2431 0.56285 5 8 5 8 12 88.2431 0.56285 2 14 2 9 11 85.9744 0.67146 6 10 6 10 10 83.0639 0.81080 7 13 7 11 9 83.0639 0.81080 1 3 1 12 8 81.4039 0.89027 2 17 2 13 7 79.8185 0.96617 6 11 6 14 6 78.7534 1.01716 4 12 4 15 5 66.2112 1.61760 2 5 2 16 4 62.0036 1.81904 1 6 1 17 3 41.0474 2.82229 1 4 1 18 2 40.1718 2.86421 2 7 2 19 1 0.0000 4.78739 1 2 1 Número de obs. en el conglomerado Paso nuevo 1 2 2 2 3 2 4 3 5 2 6 2 7 2 8 2 9 3 10 3 11 2 12 5 13 5 14 3 15 7 16 7 17 10 18 10 19 20
Partición final Dentro de la Distancia suma de promedio Distancia Número de cuadrados del desde el máxima desde observaciones conglomerado centroide centroide Conglomerado1 7 3.25713 0.612540 1.12081 Conglomerado2 7 2.72247 0.581390 0.95186 Conglomerado3 3 0.55977 0.398964 0.54907 Conglomerado4 3 0.37116 0.326533 0.48848

Conglomerados unidos

Los dos conglomerados que se unen para formar un nuevo conglomerado en cada paso del proceso de amalgamación.

Nuevo conglomerado

El número de identificación del nuevo conglomerado que se forma en cada paso del proceso de amalgamación. El número de identificación del nuevo conglomerado siempre es el más pequeño de los números de los dos conglomerados que se unen. Por ejemplo, si se unen el conglomerado 2 y el conglomerado 9, entonces el nuevo conglomerado que se forma se llama conglomerado 2.

Número de observaciones en el nuevo conglomerado

El número de observaciones de cada nuevo conglomerado que se forma en cada paso del proceso de amalgamación. En el paso final, todas las observaciones se combinan en un único conglomerado. Por lo tanto, el número de observaciones del nuevo conglomerado formado en el último paso es igual al número total de observaciones en los datos.

Nota

Para Conglomerados de variables, el número de observaciones es el número de variables del nuevo conglomerado.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política