O dendrograma é um diagrama de árvore que exibe os grupos formados por agrupamento de observações em cada passo e em seus níveis de similaridade. O nível de similaridade é medido ao longo do eixo vertical (alternativamente, você pode exibir o nível de distância) e as diferentes observações são listadas ao longo do eixo horizontal.

Interpretação

Use o dendrograma para visualizar como os agrupamentos são formados em cada passo e para avaliar os níveis de similaridade (ou distância) dos agrupamentos que são formados.

Para exibir os níveis de similaridade (ou distância), mantenha seu ponteiro sobre uma linha horizontal no dendrograma. O padrão de como a similaridade ou os valores de distância mudam de um passo para outro pode ajudar a escolher o agrupamento final dos seus dados. O passo onde os valores mudam abruptamente podem identificar um bom ponto para definir o agrupamento final.

A decisão sobre o agrupamento final também é chamada corte do dendrograma. O corte do dendrograma é similar ao desenho de uma linha por todo o dendrograma para especificar o agrupamento final. Você também pode comparar os dendrogramas a agrupamentos finais diferentes para determinar qual agrupamento final faz mais sentido para os dados.

Este dendrograma foi criado usando-se uma partição final de 4 agrupamentos, que ocorre em um nível de similaridade de aproximadamente 40. O primeiro agrupamento (extrema esquerda) é composto de sete observações (as observações nas linhas 1, 3, 6, 9, 10, 11 e 15 da worksheet). O segundo agrupamento, diretamente à direita, é composto de 3 observações (as observações nas linhas 4, 12 e 19 na worksheet). O terceiro agrupamento é composto de 7 observações (as observações nas linhas 2, 14, 17, 20, 18, 5 e 8). O quarto cluster, na extrema direita, é composto de 3 observações (as observações nas linhas 7, 13 e 16). Se você cortar o dendrograma mais alto, haveria menos agrupamentos finais, mas o nível de similaridade seria menor. Se você cortar o dendrograma mais baixo, o nível de similaridade seria maior, mas haveria mais agrupamentos finais.

Observação

Para alguns conjuntos de dados, os métodos da média, do centróide, da mediana e de Ward podem não gerar um dendrograma hierárquico. Ou seja, as distâncias de amalgamação nem sempre aumentam com cada passo. No dendrograma, esse passo produziria uma junção para baixo em vez de para cima.