Em Variáveis, insira as colunas que contêm os dados de medição.
Você deve ter duas ou mais colunas numéricas, com cada coluna representando uma medição diferente. Você deve deletar linhas com dados faltantes da worksheet antes de usar este procedimento. Quando você tem um conjunto de dados grande com diversos valores faltantes, pode ser mais conveniente criar subconjuntos da sua worksheet para excluir as linhas com valores faltantes, em vez de deletar cada linha manualmente. Para obter mais informações, acesse Visão geral da worksheet de subconjunto.
C1 | C2 | C3 | C4 | C5 |
---|---|---|---|---|
Clientes | Taxa de retorno | Vendas | Anos | Inicial |
150 | 13,5 | 50400200 | 18 | 1 |
98 | 11,7 | 45665230 | 12 | 2 |
79 | 12,0 | 19800800 | 7 | 0 |
122 | 11,4 | 42560000 | 13 | 0 |
143 | 12,4 | 47635980 | 15 | 0 |
49 | 9,8 | 22342600 | 6 | 3 |
Indicar as designações de agrupamento inicial. Os procedimentos de K-médias funcionam melhor quando você fornece pontos iniciais para agrupamentos. Baseie os agrupamentos iniciais em conhecimento prático e/ou de engenharia sobre as observações que estão sendo agrupadas. Para obter mais informações, vá para Como o processo de agrupamento de K-médias é iniciado.
Selecione Padronizar variáveis para que o Minitab pondere todas as variáveis igualmente. A padronização é uma boa prática na maioria dos casos, e é particularmente importante quando as variáveis usam diferentes escalas. Suponha que a variável A está em uma escala em dólares a partir de $0 até $10.000.000, e a variável B é uma razão em uma escala de 0,0 a 1,0. Se as variáveis não forem padronizadas, o procedimento do agrupamento coloca muito mais peso na variável A do que na variável B devido aos valores maiores de sua escala, o que, provavelmente, não é o resultado desejado. Portanto, as variáveis devem ser padronizadas.
O Minitab padroniza todas as variáveis subtraindo as médias e dividindo pelo desvio padrão antes de calcular a matriz de distâncias. Ao padronizar variáveis, o centróide geral é 0 para todos os agrupamentos.