Especifique os dados da sua análise, selecione a ligação e os métodos de distância, indique se deve ou não padronizar as variáveis, especifique a partição final e selecione as opções de gráfico.
Em Matriz de distância ou variáveis, insira as colunas que contêm os dados de medição ou uma matriz de distância armazenada que contém as distâncias entre todos os pares de observações.
Se você inserir uma matriz de distância armazenada, o Minitab não pode calcular estatísticas para a partição final.
Para os dados de medição, você deve ter duas ou mais colunas numéricas, e cada coluna deve representar uma medição diferente. Delete as linhas que têm dados faltantes da worksheet antes de realizar esta análise. Se você tiver várias linhas de dados, crie subconjuntos da sua worksheet para excluir as linhas que têm valores faltantes. Para obter mais informações, acesse Visão geral da worksheet de subconjunto.
Você não pode inserir uma variável categórica para esta análise. Se você tiver uma variável categórica, deverá, primeiro, converter os valores de texto para uma escala numérica, ou você deverá realizar uma análise separada para cada nível de variável categórica. Para obter mais informações, acesse Considerações de dados para Agrupamento de observações.
Para uma matriz de distância armazenada, a entrada na linha i e na coluna j da matriz de distância D é a distância entre as observações i e j. Para obter mais informações sobre como criar e usar matrizes armazenadas no Minitab, acesse Visão geral para matrizes.
C1 | C2 | C3 | C4 |
---|---|---|---|
Gênero | Altura | Peso | Lateralidade |
2 | 67 | 155 | 1 |
1 | 74 | 193 | 1 |
2 | 68 | 152 | 1 |
1 | 70 | 172 | 0 |
1 | 72 | 169 | 1 |
2 | 66 | 134 | 0 |
Em Método de ligação, selecione um método para especificar como a distância entre dois agrupamentos é definida. Você pode querer experimentar diversos métodos de ligação para ver qual método fornece os resultados mais úteis para seus dados.
Para Agrupamento de observações, a distância se refere à distância entre observações, e a ligação se refere à distância entre os agrupamentos de observações. Para Agrupamento de variáveis, a distância se refere à distância entre variáveis e a ligação se refere à distância entre agrupamentos de variáveis.
Se você tiver selecionado Média, Centróide, Mediana ou Ward como o método de ligação, você deve, normalmente, usar uma das medidas de distância quadrada.
Selecione Padronizar variáveis para que o Minitab pondere todas as variáveis igualmente. A padronização é uma boa prática na maioria dos casos, e é particularmente importante quando as variáveis usam diferentes escalas. Suponha que a variável A está em uma escala em dólares a partir de $0 até $10.000.000, e a variável B é uma razão em uma escala de 0,0 a 1,0. Se as variáveis não forem padronizadas, o procedimento de observações do agrupamento coloca muito mais peso na variável A do que na variável B devido aos valores maiores de sua escala, o que, provavelmente, não é o resultado desejado. Portanto, as variáveis devem ser padronizadas.
Quando você padroniza as variáveis, o Minitab torna todas as médias iguais a 0 e todas as variâncias iguais a 1. Para tornar apenas as variâncias iguais, não selecione a opção padronizada, mas, em vez disso, selecione Pearson ou Pearson ao quadrado em Medida de distância.
Para os melhores resultados, você deve ser flexível com os critérios. Por exemplo, se definir a partição final usando o número de agrupamentos, você deverá também considerar mudanças no nível de similaridade, também. Uma queda abrupta na similaridade ao adicionar um agrupamento específico pode avisá-lo para especificar a partição final antes deste agrupamento. Por outro lado, se você definir a partição final usando o nível de similaridade, poderá determinar quais níveis de similaridade não mudam muito com relação a uma faixa de agrupamentos e, para fins de simplicidade, você pode escolher o passo com o menor número de agrupamentos.
Se você não souber que valor inserir para especificar a partição final, primeiro realize a análise usando a configuração padrão (1 agrupamento na partição final). O Minitab exibe os resultados para todos os números possíveis de agrupamentos. Use os resultados para determinar um valor a inserir para a partição final. Depois, repita a análise e especifique a partição final que você determinou. Para obter mais informações, vá para Determinar o agrupamento final dos agrupamentos.
Selecione para exibir um diagrama de árvore que mostra como os agrupamentos foram formados em cada passo no procedimento de amalgamação. O dendrograma permite visualizar os valores de similaridade (ou distância) para os agrupamentos em cada passo.
Para mudar a exibição padrão do dendrograma, clique em Personalizar.