Em cada passo no processo de amalgamação, exiba os agrupamentos que são formados e examine os níveis de similaridade e de distância. Quanto maior o nível de similaridade, mais similares as observações estão em cada agrupamento. Quanto menor o nível de distância, mais próximas as observações estão em cada agrupamento.
Idealmente, os agrupamentos devem ter um nível de similaridade relativamente alto e um nível de distância relativamente baixo. Contudo, você deve equilibrar aquela meta com a existência de um número prático e razoável de agrupamentos.
Passo | Número de agrupados | Nível de similaridade | Nível de distância | Agrupados reunidos | Novo agrupado | Número de obs. no novo agrupado | |
---|---|---|---|---|---|---|---|
1 | 19 | 96,6005 | 0,16275 | 13 | 16 | 13 | 2 |
2 | 18 | 95,4642 | 0,21715 | 17 | 20 | 17 | 2 |
3 | 17 | 95,2648 | 0,22669 | 6 | 9 | 6 | 2 |
4 | 16 | 92,9178 | 0,33905 | 17 | 18 | 17 | 3 |
5 | 15 | 90,5296 | 0,45339 | 11 | 15 | 11 | 2 |
6 | 14 | 90,3124 | 0,46378 | 12 | 19 | 12 | 2 |
7 | 13 | 88,2431 | 0,56285 | 2 | 14 | 2 | 2 |
8 | 12 | 88,2431 | 0,56285 | 5 | 8 | 5 | 2 |
9 | 11 | 85,9744 | 0,67146 | 6 | 10 | 6 | 3 |
10 | 10 | 83,0639 | 0,81080 | 7 | 13 | 7 | 3 |
11 | 9 | 83,0639 | 0,81080 | 1 | 3 | 1 | 2 |
12 | 8 | 81,4039 | 0,89027 | 2 | 17 | 2 | 5 |
13 | 7 | 79,8185 | 0,96617 | 6 | 11 | 6 | 5 |
14 | 6 | 78,7534 | 1,01716 | 4 | 12 | 4 | 3 |
15 | 5 | 66,2112 | 1,61760 | 2 | 5 | 2 | 7 |
16 | 4 | 62,0036 | 1,81904 | 1 | 6 | 1 | 7 |
17 | 3 | 41,0474 | 2,82229 | 1 | 4 | 1 | 10 |
18 | 2 | 40,1718 | 2,86421 | 2 | 7 | 2 | 10 |
19 | 1 | 0,0000 | 4,78739 | 1 | 2 | 1 | 20 |
Nesses resultados, os dados contêm um total de 20 observações. Na etapa 1, dois agrupamentos (observações 13 e 16 na worksheet) são unidos para formar um novo agrupamento. Essa etapa cria 19 agrupamentos nos dados, com um nível de similaridade de 96,6005 e um nível de distância de 0,16275. Apesar de o nível de similaridade ser alto e o nível de distância ser baixo, o número de agrupamentos é muito alto para ser útil. Em cada passo subsequente, conforme novos agrupamentos são formados, o nível de similaridade diminui e o nível de distância aumenta. No passo final, todas as observações são unidas em um agrupamento único.
Para exibir os níveis de similaridade no dendrograma, mantenha o ponteiro sobre uma linha horizontal no diagrama de árvore, no Minitab.
Use o nível de similaridade para os agrupamentos que estão unidos em cada passo para ajudar a determinar os agrupamentos finais dos dados.Procure uma mudança abrupta no nível de similaridade entre passos. O passo que precede a mudança abrupta na similaridade pode fornecer um bom ponto de corte para a partição final. Para a partição final, os agrupamentos devem ter um nível de similaridade razoavelmente altos. Você deve usar também seu conhecimento prático dos dados para determinar os agrupamentos finais que fazem mais sentido para sua aplicação.
Por exemplo, a seguinte tabela de amalgamação mostra que o nível de similaridade diminui pelos incrementos de aproximadamente 3 ou menos até o passo 15. A similaridade diminui em mais de 20 (de 62,0036 a 41,0474) nos passos 16 e 17, quando o número de agrupamentos muda de 4 para 3. Esses resultados indicam que 4 agrupamentos podem ser suficientes para a partição final. Se este agrupamento fizer sentido intuitivo, ele é provavelmente uma boa escolha.
Passo | Número de agrupados | Nível de similaridade | Nível de distância | Agrupados reunidos | Novo agrupado | Número de obs. no novo agrupado | |
---|---|---|---|---|---|---|---|
1 | 19 | 96,6005 | 0,16275 | 13 | 16 | 13 | 2 |
2 | 18 | 95,4642 | 0,21715 | 17 | 20 | 17 | 2 |
3 | 17 | 95,2648 | 0,22669 | 6 | 9 | 6 | 2 |
4 | 16 | 92,9178 | 0,33905 | 17 | 18 | 17 | 3 |
5 | 15 | 90,5296 | 0,45339 | 11 | 15 | 11 | 2 |
6 | 14 | 90,3124 | 0,46378 | 12 | 19 | 12 | 2 |
7 | 13 | 88,2431 | 0,56285 | 2 | 14 | 2 | 2 |
8 | 12 | 88,2431 | 0,56285 | 5 | 8 | 5 | 2 |
9 | 11 | 85,9744 | 0,67146 | 6 | 10 | 6 | 3 |
10 | 10 | 83,0639 | 0,81080 | 7 | 13 | 7 | 3 |
11 | 9 | 83,0639 | 0,81080 | 1 | 3 | 1 | 2 |
12 | 8 | 81,4039 | 0,89027 | 2 | 17 | 2 | 5 |
13 | 7 | 79,8185 | 0,96617 | 6 | 11 | 6 | 5 |
14 | 6 | 78,7534 | 1,01716 | 4 | 12 | 4 | 3 |
15 | 5 | 66,2112 | 1,61760 | 2 | 5 | 2 | 7 |
16 | 4 | 62,0036 | 1,81904 | 1 | 6 | 1 | 7 |
17 | 3 | 41,0474 | 2,82229 | 1 | 4 | 1 | 10 |
18 | 2 | 40,1718 | 2,86421 | 2 | 7 | 2 | 10 |
19 | 1 | 0,0000 | 4,78739 | 1 | 2 | 1 | 20 |
A decisão sobre o agrupamento final também é chamado corte do dendrograma. O corte do dendrograma é similar ao desenho de uma linha horizontal por todo o dendrograma para especificar o agrupamento final. Por exemplo, para cortar este dendrograma em quatro agrupamentos, imagina desenhar uma linha horizontal para baixo pela metade do eixo vertical, logo abaixo do nível de similaridade de aproximadamente 41.
Depois de determinar os agrupamentos finais na etapa 2, repita a análise e especifique o número de agrupamentos (ou o nível de similaridade) para a partição final. O Minitab exibe a tabela da partição final, que mostra as características de cada agrupamento na partição final. Por exemplo, a distância média do centróide fornece uma medida da variabilidade das observações dentro de cada agrupamento.
Para obter mais informações sobre essas estatísticas, vá para Partição final.
Número de observações | Dentro da soma de quadrados do agrupado | Distância média do centróide | Distância máxima do centróide | |
---|---|---|---|---|
Agrupado1 | 7 | 3,25713 | 0,612540 | 1,12081 |
Agrupado2 | 7 | 2,72247 | 0,581390 | 0,95186 |
Agrupado3 | 3 | 0,55977 | 0,398964 | 0,54907 |
Agrupado4 | 3 | 0,37116 | 0,326533 | 0,48848 |
Variável | Agrupado1 | Agrupado2 | Agrupado3 | Agrupado4 | Centróide global |
---|---|---|---|---|---|
Gênero | 0,97468 | -0,97468 | 0,97468 | -0,97468 | -0,0000000 |
Altura | -1,00352 | 1,01283 | -0,37277 | 0,35105 | 0,0000000 |
Peso | -0,90672 | 0,93927 | -0,86797 | 0,79203 | -0,0000000 |
Lateralidade | 0,63808 | 0,63808 | -1,48885 | -1,48885 | 0,0000000 |
Agrupado1 | Agrupado2 | Agrupado3 | Agrupado4 | |
---|---|---|---|---|
Agrupado1 | 0,00000 | 3,35759 | 2,21882 | 3,61171 |
Agrupado2 | 3,35759 | 0,00000 | 3,67557 | 2,23236 |
Agrupado3 | 2,21882 | 3,67557 | 0,00000 | 2,66074 |
Agrupado4 | 3,61171 | 2,23236 | 2,66074 | 0,00000 |
Este dendrograma foi criado usando-se uma partição final de 4 agrupamentos, que ocorre em um nível de similaridade de aproximadamente 40. O primeiro agrupamento (extrema esquerda) é composto de sete observações (as observações nas linhas 1, 3, 6, 9, 10, 11 e 15 da worksheet). O segundo agrupamento, diretamente à direita, é composto de 3 observações (as observações nas linhas 4, 12 e 19 da worksheet). O terceiro agrupamento é composto de 7 observações (as observações nas linhas 2, 14, 17, 20, 18, 5 e 8). O quarto cluster, na extrema direita, é composto de 3 observações (as observações nas linhas 7, 13 e 16). Se você cortar o dendrograma mais alto, haveria menos agrupamentos finais, mas o nível de similaridade seria menor. Se você cortar o dendrograma mais baixo, o nível de similaridade seria maior, mas haveria mais agrupamentos finais.