Interpretar todos los estadísticos y gráficas para Conglomerados de k-medias

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos y gráficas que se proporcionan con el análisis de conglomerado de k-medias.

Número de observaciones

El número de observaciones de cada conglomerado incluido en la partición final.

Interpretación

Examine el número de observaciones de cada conglomerado cuando interprete las medidas de variabilidad, tales como la distancia promedio y las suma de los cuadrados dentro del conglomerado. La variabilidad de un conglomerado se puede ver afectada por el hecho de tener un número más pequeño o más grande de observaciones. Por ejemplo, la suma de los cuadrados dentro del conglomerado se hace más grande a medida que se agregan más observaciones.

Examine los conglomerados que tengan significativamente menos observaciones que otros conglomerados. Los conglomerados que tienen muy pocas observaciones pueden contener valores atípicos u observaciones poco comunes con características únicas.

Suma de los cuadrados dentro del conglomerado

La suma de las desviaciones al cuadrado de cada observación y el centroide del conglomerado.

Interpretación

La suma de los cuadrados dentro del conglomerado es una medida de la variabilidad de las observaciones dentro de cada conglomerado. En general, un conglomerado que tiene una suma de los cuadrados pequeña es más compacto que uno que tiene una suma de los cuadrados grande. Los conglomerados que tienen valores más altos muestran una mayor variabilidad de las observaciones dentro del conglomerado.

Sin embargo, al igual que las sumas de los cuadrados y los cuadrados medios en ANOVA, la suma de los cuadrados dentro del conglomerado se ve afectada por el número de observaciones. A medida que aumenta el número de observaciones, la suma de los cuadrados se hace más grande. Por lo tanto, comúnmente la suma de los cuadrados dentro del conglomerado no se puede comparar directamente entre conglomerados con diferentes números de observaciones. Para comparar la variabilidad dentro del conglomerado cuando se trata de conglomerados diferentes, utilice más bien la distancia promedio desde el centroide.

Distancia promedio desde el centroide

El promedio de las distancias desde las observaciones hasta el centroide de cada conglomerado.

Interpretación

La distancia promedio desde las observaciones hasta el centroide del conglomerado es una medida de la variabilidad de las observaciones dentro de cada conglomerado. En general, un conglomerado que tiene una distancia promedio más pequeña es más compacto que un conglomerado que tiene una distancia promedio más grande. Los conglomerados que tienen valores más altos muestran una mayor variabilidad de las observaciones dentro del conglomerado.

Distancia máxima desde el centroide

El máximo de las distancias desde las observaciones hasta el centroide de cada conglomerado.

Interpretación

La distancia máxima desde las observaciones hasta el centroide del conglomerado es una medida de la variabilidad de las observaciones dentro de cada conglomerado. Un valor máximo más alto, especialmente en relación con la distancia promedio, indica una observación del conglomerado que se encuentra más distante del centroide del conglomerado.

Centroide de conglomerado

El medio de un conglomerado. Un centroide es un vector que contiene un número para cada variable, donde cada número es la media de una variable para las observaciones en ese conglomerado. El centroide se puede considerar como el promedio multidimensional del conglomerado.

Interpretación

Utilice el centroide del conglomerado como una medida general de la ubicación del conglomerado y como ayuda para interpretar cada conglomerado. Cada centroide puede verse como la representación de la "observación promedio" dentro de un conglomerado para todas las variables incluidas en el análisis.

Minitab calcula las distancias entre los centroides de los conglomerados que están incluidos en la partición final. Para cada conglomerado, Minitab también calcula diversas medidas de distancia entre el centroide del conglomerado y las observaciones dentro del conglomerado. Para obtener más información, consulte el tema correspondiente a cada medida de distancia.

Centroide principal

El centroide principal es un vector de medias de variables para todas las observaciones.

Distancias entre los centroides de los conglomerados

Las distancias entre los centroides de los conglomerados miden qué tan distantes están entre sí los centroides de los conglomerados de la partición final.

Interpretación

Aunque los valores de distancia no ofrecen mucha información por sí solos, usted puede comparar las distancias para determinar qué tan diferentes entre sí son los conglomerados. Una distancia más grande por lo general indica una mayor diferencia entre los conglomerados.