Consideraciones acerca de los datos para Conglomerados de variables

Para asegurar que los resultados sean válidos, considere las siguientes pautas al recopilar datos, realizar el análisis e interpretar los resultados.

Puede tener datos sin procesar o una matriz de distancias

Por lo general, para este análisis se utilizan datos sin procesar. Cada fila contiene mediciones de un solo elemento o sujeto. Debe tener dos o más columnas numéricas, donde cada columna represente una medición diferente. Debe eliminar las filas con datos faltantes de la hoja de trabajo antes de utilizar este análisis.

Si usted almacena una matriz de distancia p x p, donde p es el número de variables, entonces puede usar la matriz para el análisis. La entrada (i, j) de la matriz es la distancia entre las variables i y j. Si usted usa una matriz de distancia, Minitab no puede calcular los estadísticos de la partición final.

Los datos deben ser numéricos
Para formar los conglomerados, este análisis calcula la distancia entre las variables, que no se puede medir entre los niveles de una variable categórica. Para utilizar una variable categórica en el análisis, primero debe convertir los valores de texto a una escala numérica. Por ejemplo, un analista mide la satisfacción del cliente utilizando las categorías "Muy satisfecho", "Satisfecho", "Insatisfecho" y "Muy insatisfecho". Para realizar el conglomerado de variables, el analista recodifica estas categorías como +2, +1, −1, −2. Ahora las distancias entre las variables se pueden calcular para el análisis. Alternativamente, podría dividir la hoja de trabajo en hojas de trabajo separadas para cada nivel de la variable categórica y agrupar las variables en cada nivel. Para obtener más información sobre cómo dividir la hoja de trabajo, vaya a Revisión general de Dividir hoja de trabajo.