En Matriz de distancia o variables, ingrese las columnas que contienen los datos de las mediciones o una matriz de distancia almacenada que contenga las distancias entre todos los pares de variables.
Si usted especifica una matriz de distancia almacenada, Minitab no puede calcular los estadísticos de la partición final.
Para los datos de mediciones, debe tener dos o más columnas numéricas, y cada columna debe representar una medición diferente. Elimine de la hoja de trabajo las filas que tengan datos faltantes antes de realizar este análisis. Si tiene muchas filas de datos, debería crear un subconjunto de la hoja de trabajo para excluir las filas con valores faltantes. Para obtener más información, vaya a Revisión general de crear subconjunto de hoja de trabajo.
Usted no puede ingresar una variable categórica para este análisis. Si tiene una variable categórica, primero debe convertir los valores de texto a una escala numérica o debe realizar un análisis separado para cada nivel de la variable categórica. Para obtener más información, vaya a Consideraciones acerca de los datos para Conglomerados de variables.
Para la matriz de distancia almacenada, la entrada en la fila i y la columna j de la matriz de distancia D es la distancia entre las variables i y j. Para obtener información sobre cómo crear y usar matrices almacenadas en Minitab, vaya a Descripción general de matrices.
C1 | C2 | C3 | C4 | C5 |
---|---|---|---|---|
Periódico | Radio | Televisores | Alfabetismo | Universidad |
279 | 267 | 227 | 0,98 | 1 |
143 | 112 | 332 | 0,94 | 1 |
9 | 113 | 7 | 0,25 | 0 |
391 | 314 | 566 | 0,99 | 1 |
112 | 48 | 423 | 0,82 | 1 |
67 | 66 | 134 | 0,45 | 0 |
En Método de vinculación, seleccione un método para especificar cómo se define la distancia entre dos conglomerados. Se recomienda probar varios métodos de enlace para determinar cuál método proporciona los resultados más útiles para los datos.
Cuando se trata de Conglomerados de observaciones, distancia se refiere a la distancia entre las observaciones y enlace se refiere a la distancia entre los conglomerados de observaciones. En el caso de los Conglomerados de variables, distancia se refiere a la distancia entre las variables y enlace se refiere a la distancia entre los conglomerados de variables.
Para obtener los mejores resultados, debe ser flexible con los criterios. Por ejemplo, si define la partición final usando el número de conglomerados, también debe considerar los cambios en el nivel de similitud. Una fuerte caída en el nivel de similitud cuando se agrega un conglomerado específico podría indicar que la partición final se debe especificar antes de esta agrupación. Por el contrario, si define la partición final usando el nivel de similitud, podría determinar que los niveles de similitud no cambian mucho en un rango de conglomerados y, por razones de simplicidad, podría optar por seleccionar el paso con el menor número de conglomerados.
Si no sabe qué valor ingresar para especificar la partición final, primero realice el análisis utilizando el valor predeterminado (1 conglomerado en la partición final). Minitab muestra los resultados para todos los números posibles de conglomerados. Utilice los resultados para determinar el valor que ingresará para la partición final. Luego repita el análisis y especifique la partición final que determinó. Para obtener más información, vaya a Determinar la agrupación final de conglomerados.
Seleccione esta opción para mostrar un diagrama de árbol que muestra cómo se formaron los conglomerados en cada paso del procedimiento de amalgamación. El dendrograma permite ver los valores de similitud (o distancia) de los conglomerados en cada paso.
Para cambiar la presentación predeterminada del dendrograma, haga clic en Personalizar.