En Variables, ingrese las columnas que contienen los datos de las mediciones.
Debe tener dos o más columnas numéricas, donde cada columna represente una medición diferente. Debe eliminar las filas con datos faltantes de la hoja de trabajo antes de utilizar este procedimiento. Cuando tenga un conjunto de datos grande con muchos valores faltantes, pudiera ser más conveniente crear un subconjunto de la hoja de trabajo para excluir las filas con valores faltantes, en lugar de eliminar cada fila de forma manual. Para obtener más información, vaya a Revisión general de crear subconjunto de hoja de trabajo.
C1 | C2 | C3 | C4 | C5 |
---|---|---|---|---|
Clientes | Tasa de retorno | Ventas | Años | Inicial |
150 | 13,5 | 50400200 | 18 | 1 |
98 | 11,7 | 45665230 | 12 | 2 |
79 | 12,0 | 19800800 | 7 | 0 |
122 | 11,4 | 42560000 | 13 | 0 |
143 | 12,4 | 47635980 | 15 | 0 |
49 | 9,8 | 22342600 | 6 | 3 |
Indique las designaciones iniciales de conglomerados. Los procedimientos de k-medias funcionan mejor cuando usted proporciona puntos iniciales adecuados para los conglomerados. Base los conglomerados iniciales en el conocimiento práctico y/o de ingeniería acerca de las observaciones que se agruparán. Para obtener más información, vaya a Cómo se inicia el proceso de conglomerados de K-medias.
Seleccione Estandarizar variables para que Minitab pondere todas las variables de igual manera. La estandarización es una práctica adecuada en la mayoría de los casos y resulta particularmente importante cuando las variables utilizan diferentes escalas. Supongamos que la variable A está en una escala en dólares de $0 a $10,000,000 y la variable B es una relación en una escala de 0.0 a 1.0. Si las variables no están estandarizadas, entonces el procedimiento de formación de conglomerados concede mucho más peso a la variable A que a la variable B debido a los valores más grandes de su escala, lo que probablemente no sea el resultado deseado. Por lo tanto, las variables se deben estandarizar.
Minitab estandariza todas las variables restando las medias y dividiendo entre la desviación estándar antes de calcular la matriz de distancia. Cuando usted estandariza las variables, el centroide principal es 0 para todos los conglomerados.