Especifique los datos para el análisis, seleccione los métodos de enlace y distancia, indique si desea estandarizar las variables, especifique la partición final y seleccione las opciones de gráficas.
En Matriz de distancia o variables, ingrese las columnas que contienen los datos de las mediciones o una matriz de distancia almacenada que contenga las distancias entre todos los pares de observaciones.
Si usted especifica una matriz de distancia almacenada, Minitab no puede calcular los estadísticos de la partición final.
Para los datos de mediciones, debe tener dos o más columnas numéricas, y cada columna debe representar una medición diferente. Elimine de la hoja de trabajo las filas que tengan datos faltantes antes de realizar este análisis. Si tiene muchas filas de datos, debería crear un subconjunto de la hoja de trabajo para excluir las filas que tengan valores faltantes. Para obtener más información, vaya a Revisión general de crear subconjunto de hoja de trabajo.
Usted no puede ingresar una variable categórica para este análisis. Si tiene una variable categórica, primero debe convertir los valores de texto a una escala numérica o debe realizar un análisis separado para cada nivel de la variable categórica. Para obtener más información, vaya a Consideraciones acerca de los datos para Conglomerados de observaciones.
Para una matriz de distancia almacenada, la entrada en la fila i y columna j de la matriz de distancia D es la distancia entre las observaciones i y j. Para obtener información sobre cómo crear y usar matrices almacenadas en Minitab, vaya a Descripción general de matrices.
C1 | C2 | C3 | C4 |
---|---|---|---|
Sexo | Altura | Ponderación | Pref mano |
2 | 67 | 155 | 1 |
1 | 74 | 193 | 1 |
2 | 68 | 152 | 1 |
1 | 70 | 172 | 0 |
1 | 72 | 169 | 1 |
2 | 66 | 134 | 0 |
En Método de vinculación, seleccione un método para especificar cómo se define la distancia entre dos conglomerados. Se recomienda probar varios métodos de enlace para determinar cuál método proporciona los resultados más útiles para los datos.
Cuando se trata de Conglomerados de observaciones, distancia se refiere a la distancia entre las observaciones y enlace se refiere a la distancia entre los conglomerados de observaciones. En el caso de los Conglomerados de variables, distancia se refiere a la distancia entre las variables y enlace se refiere a la distancia entre los conglomerados de variables.
Si seleccionó Promedio, Centroide, Mediana o Ward como el método de enlace, por lo general debería usar una de las medidas de distancia al cuadrado.
Seleccione Estandarizar variables para que Minitab pondere todas las variables de igual manera. La estandarización es una práctica adecuada en la mayoría de los casos y resulta particularmente importante cuando las variables utilizan diferentes escalas. Supongamos que la variable A está en una escala en dólares de $0 a $10,000,000 y la variable B es una relación en una escala de 0.0 a 1.0. Si las variables no están estandarizadas, entonces el procedimiento de formación de conglomerados de observaciones concede mucho más peso a la variable A que a la variable B debido a los valores más grandes de su escala, lo que probablemente no sea el resultado deseado. Por lo tanto, las variables se deben estandarizar.
Cuando usted estandariza las variables, Minitab hace que todas las medias sean iguales a 0 y que todas las varianzas sean iguales a 1. Para hacer que solo las varianzas sean iguales, no seleccione la opción para estandarizar y en cambio elija Pearson o Pearson cuadrado en Medición de la distancia.
Para obtener los mejores resultados, debe ser flexible con los criterios. Por ejemplo, si define la partición final usando el número de conglomerados, también debe considerar los cambios en el nivel de similitud. Una fuerte caída en el nivel de similitud cuando se agrega un conglomerado específico podría indicar que la partición final se debe especificar antes de esta agrupación. Por el contrario, si define la partición final usando el nivel de similitud, podría determinar que los niveles de similitud no cambian mucho en un rango de conglomerados y, por razones de simplicidad, podría optar por seleccionar el paso con el menor número de conglomerados.
Si no sabe qué valor ingresar para especificar la partición final, primero realice el análisis utilizando el valor predeterminado (1 conglomerado en la partición final). Minitab muestra los resultados para todos los números posibles de conglomerados. Utilice los resultados para determinar el valor que ingresará para la partición final. Luego repita el análisis y especifique la partición final que determinó. Para obtener más información, vaya a Determinar la agrupación final de conglomerados.
Seleccione esta opción para mostrar un diagrama de árbol que muestra cómo se formaron los conglomerados en cada paso del procedimiento de amalgamación. El dendrograma permite ver los valores de similitud (o distancia) de los conglomerados en cada paso.
Para cambiar la presentación predeterminada del dendrograma, haga clic en Personalizar.