Passos de amalgamação

Encontre definições e interpretação para cada estatística que é fornecida nos resultados para os passos da amalgamação.

Etapa

O número do passo no procedimento de amalgamação para unir os agrupamentos. Em cada passo, um novo agrupamento é unido a um agrupamento existente e seu nível de similaridade e o nível de distância são calculados.

Número de agrupamentos

O número de agrupamentos que são formados em cada passo do processo de amalgamação. Antes do primeiro passo, o número de agrupamentos é igual ao número total de observações (para observações de agrupamentos) ou o número total de variáveis (para agrupamento de variáveis). No primeiro passo, dois agrupamentos são unidos para formar um novo agrupamento. Em cada passo subsequente, outro agrupamento é unido a um agrupamento existente para formar um novo agrupamento. No passo final, todas as observações ou variáveis são combinadas em um agrupamento único.

Você pode inserir o número de agrupamentos na caixa de diálogo principal, para especificar a partição final dos seus dados. Sua escolha do método de ligação e medida de distância influencia enormemente o resultado do agrupamento.

Nível de similaridade

A porcentagem da distância mínima entre agrupamentos de cada passo de amalgamação relativo à distância interobservação máxima nos dados. A similaridade, s(ij), entre dois agrupamentos i e j é dada por s(ij) = 100 * [1 - d(ij)) / d(max)], onde d(max) é o valor máximo na matriz da distância original, D, com entrada d(ij) para a distância entre i e j.

Interpretação

Use o nível de similaridade para os agrupamentos que estão unidos em cada passo para ajudar a determinar os agrupamentos finais dos dados. Procure uma mudança abrupta no nível de similaridade entre passos. O passo que precede a mudança abrupta na similaridade pode fornecer um bom ponto de corte para a partição final. Para a partição final, os agrupamentos devem ter um nível de similaridade razoavelmente altos. Você deve usar também seu conhecimento prático dos dados para determinar os agrupamentos finais que fazem mais sentido para sua aplicação.

Por exemplo, a seguinte tabela de amalgamação mostra que o nível de similaridade diminui pelos incrementos de aproximadamente 3 ou menos até o passo 15. A similaridade diminui em mais de 20 (de 62,0036 a 41,0474) nos passos 16 e 17, quando o número de agrupamentos muda de 4 para 3. Esses resultados indicam que 4 agrupamentos podem ser suficientes para a partição final. Se este agrupamento fizer sentido intuitivo, ele é provavelmente uma boa escolha.

Passos de Amalgamação Número de obs. no Número de Nível de Nível de Agrupados Novo novo Passo agrupados similaridade distância reunidos agrupado agrupado 1 19 96,6005 0,16275 13 16 13 2 2 18 95,4642 0,21715 17 20 17 2 3 17 95,2648 0,22669 6 9 6 2 4 16 92,9178 0,33905 17 18 17 3 5 15 90,5296 0,45339 11 15 11 2 6 14 90,3124 0,46378 12 19 12 2 7 13 88,2431 0,56285 5 8 5 2 8 12 88,2431 0,56285 2 14 2 2 9 11 85,9744 0,67146 6 10 6 3 10 10 83,0639 0,81080 7 13 7 3 11 9 83,0639 0,81080 1 3 1 2 12 8 81,4039 0,89027 2 17 2 5 13 7 79,8185 0,96617 6 11 6 5 14 6 78,7534 1,01716 4 12 4 3 15 5 66,2112 1,61760 2 5 2 7 16 4 62,0036 1,81904 1 6 1 7 17 3 41,0474 2,82229 1 4 1 10 18 2 40,1718 2,86421 2 7 2 10 19 1 0,0000 4,78739 1 2 1 20
Dica

Para avaliar visualmente os níveis de similaridade em cada passo, use o dendrograma.

Nível de distância

A distância entre agrupamentos (usando-se o método de ligação escolhido) ou variáveis (usando-se a medição da distância escolhida) que são unidos em cada passo. O Minitab calcula o nível da distância com base no método de ligação e na medição da distância que você selecionou na caixa de diálogo principal.

Interpretação

Use o nível de distância para os agrupamentos que são unidos em cada passo para ajudar a determinar os agrupamentos finais dos dados. Procure uma mudança abrupta no nível da distância entre passos. O passo que precede a mudança abrupta na distância pode fornecer um bom ponto de corte para a partição final. Para a partição final, os agrupamentos devem ter um nível de distância razoavelmente pequeno. Você deve usar também seu conhecimento prático dos dados para determinar os agrupamentos finais que fazem mais sentido para sua aplicação.

Por exemplo, a tabela de amalgamação a seguir mostra que o nível de distância aumenta em aproximadamente 0,6 ou menos para os primeiros 15 passos. Contudo, nas etapas 16 e 17, quando o número de agrupamentos muda de 4 para 3, o nível da distância aumenta em mais de 1 (de 1,81904 para 2,82229). Esses resultados indicam que 4 clusters podem ser suficientes para a partição final. Se este agrupamento fizer sentido intuitivo, ele é provavelmente uma boa escolha.

Passos de Amalgamação Número de obs. no Número de Nível de Nível de Agrupados Novo novo Passo agrupados similaridade distância reunidos agrupado agrupado 1 19 96,6005 0,16275 13 16 13 2 2 18 95,4642 0,21715 17 20 17 2 3 17 95,2648 0,22669 6 9 6 2 4 16 92,9178 0,33905 17 18 17 3 5 15 90,5296 0,45339 11 15 11 2 6 14 90,3124 0,46378 12 19 12 2 7 13 88,2431 0,56285 5 8 5 2 8 12 88,2431 0,56285 2 14 2 2 9 11 85,9744 0,67146 6 10 6 3 10 10 83,0639 0,81080 7 13 7 3 11 9 83,0639 0,81080 1 3 1 2 12 8 81,4039 0,89027 2 17 2 5 13 7 79,8185 0,96617 6 11 6 5 14 6 78,7534 1,01716 4 12 4 3 15 5 66,2112 1,61760 2 5 2 7 16 4 62,0036 1,81904 1 6 1 7 17 3 41,0474 2,82229 1 4 1 10 18 2 40,1718 2,86421 2 7 2 10 19 1 0,0000 4,78739 1 2 1 20

Agrupamentos unidos

Os dois agrupamentos que estão unidos para formar um novo agrupamento em cada passo no processo de amalgamação.

Novo agrupamento

O número de identificação do novo agrupamento que é formado em cada passo no processo de amalgamação. O número de identificação do novo agrupamento é sempre o menor dos números de identificação dos dois agrupamentos que estão unidos. Por exemplo, se o agrupamento 2 e o agrupamento 9 estiverem unidos, o novo agrupamento que é formado é chamado agrupamento 2.

Número de observações no novo agrupamento

O número de observações em cada novo agrupamento em cada passo no processo de amalgamação. No passo final, todas as observações são combinadas em um agrupamento simples. Portanto, o número de observações no novo agrupamento para o último passo iguala o número total de observações nos dados.

Observação

Para Agrupar variáveis, o número de observações é o número de variáveis no novo agrupamento.

Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política