Interpretar os principais resultados para Agrupar observações

Conclua as etapas a seguir para interpretar uma análise de agrupamentos de observações. A saída principal inclui valores de similaridade e de distância, o dendrograma e a partição final.

Etapa 1: Examinar os níveis de similaridade e de distância

Em cada passo no processo de amalgamação, exiba os agrupamentos que são formados e examine os níveis de similaridade e de distância. Quanto maior o nível de similaridade, mais similares as observações estão em cada agrupamento. Quanto menor o nível de distância, mais próximas as observações estão em cada agrupamento.

Idealmente, os agrupamentos devem ter um nível de similaridade relativamente alto e um nível de distância relativamente baixo. Contudo, você deve equilibrar aquela meta com a existência de um número prático e razoável de agrupamentos.

Passos de Amalgamação Número de obs. no Número de Nível de Nível de Agrupados Novo novo Passo agrupados similaridade distância reunidos agrupado agrupado 1 19 96,6005 0,16275 13 16 13 2 2 18 95,4642 0,21715 17 20 17 2 3 17 95,2648 0,22669 6 9 6 2 4 16 92,9178 0,33905 17 18 17 3 5 15 90,5296 0,45339 11 15 11 2 6 14 90,3124 0,46378 12 19 12 2 7 13 88,2431 0,56285 5 8 5 2 8 12 88,2431 0,56285 2 14 2 2 9 11 85,9744 0,67146 6 10 6 3 10 10 83,0639 0,81080 7 13 7 3 11 9 83,0639 0,81080 1 3 1 2 12 8 81,4039 0,89027 2 17 2 5 13 7 79,8185 0,96617 6 11 6 5 14 6 78,7534 1,01716 4 12 4 3 15 5 66,2112 1,61760 2 5 2 7 16 4 62,0036 1,81904 1 6 1 7 17 3 41,0474 2,82229 1 4 1 10 18 2 40,1718 2,86421 2 7 2 10 19 1 0,0000 4,78739 1 2 1 20
Principais resultados: Nível de similaridade, Nível de distância

Nesses resultados, os dados contêm um total de 20 observações. Na etapa 1, dois agrupamentos (observações 13 e 16 na worksheet) são unidos para formar um novo agrupamento. Essa etapa cria 19 agrupamentos nos dados, com um nível de similaridade de 96,6005 e um nível de distância de 0,16275. Apesar de o nível de similaridade ser alto e o nível de distância ser baixo, o número de agrupamentos é muito alto para ser útil. Em cada passo subsequente, conforme novos agrupamentos são formados, o nível de similaridade diminui e o nível de distância aumenta. No passo final, todas as observações são unidas em um agrupamento único.

Para exibir os níveis de similaridade no dendrograma, mantenha o ponteiro sobre uma linha horizontal no diagrama de árvore, no Minitab.

Etapa 2: Determinar os agrupamentos finais dos seus dados

Use o nível de similaridade para os agrupamentos que estão unidos em cada passo para ajudar a determinar os agrupamentos finais dos dados. Procure uma mudança abrupta no nível de similaridade entre passos. O passo que precede a mudança abrupta na similaridade pode fornecer um bom ponto de corte para a partição final. Para a partição final, os agrupamentos devem ter um nível de similaridade razoavelmente altos. Você deve usar também seu conhecimento prático dos dados para determinar os agrupamentos finais que fazem mais sentido para sua aplicação.

Por exemplo, a seguinte tabela de amalgamação mostra que o nível de similaridade diminui pelos incrementos de aproximadamente 3 ou menos até o passo 15. A similaridade diminui em mais de 20 (de 62,0036 a 41,0474) nos passos 16 e 17, quando o número de agrupamentos muda de 4 para 3. Esses resultados indicam que 4 agrupamentos podem ser suficientes para a partição final. Se este agrupamento fizer sentido intuitivo, ele é provavelmente uma boa escolha.

Passos de Amalgamação Número de obs. no Número de Nível de Nível de Agrupados Novo novo Passo agrupados similaridade distância reunidos agrupado agrupado 1 19 96,6005 0,16275 13 16 13 2 2 18 95,4642 0,21715 17 20 17 2 3 17 95,2648 0,22669 6 9 6 2 4 16 92,9178 0,33905 17 18 17 3 5 15 90,5296 0,45339 11 15 11 2 6 14 90,3124 0,46378 12 19 12 2 7 13 88,2431 0,56285 5 8 5 2 8 12 88,2431 0,56285 2 14 2 2 9 11 85,9744 0,67146 6 10 6 3 10 10 83,0639 0,81080 7 13 7 3 11 9 83,0639 0,81080 1 3 1 2 12 8 81,4039 0,89027 2 17 2 5 13 7 79,8185 0,96617 6 11 6 5 14 6 78,7534 1,01716 4 12 4 3 15 5 66,2112 1,61760 2 5 2 7 16 4 62,0036 1,81904 1 6 1 7 17 3 41,0474 2,82229 1 4 1 10 18 2 40,1718 2,86421 2 7 2 10 19 1 0,0000 4,78739 1 2 1 20
Principais resultados: Nível de similaridade, número de agrupamentos

A decisão sobre o agrupamento final também é chamado corte do dendrograma. O corte do dendrograma é similar ao desenho de uma linha horizontal por todo o dendrograma para especificar o agrupamento final. Por exemplo, para cortar este dendrograma em quatro agrupamentos, imagina desenhar uma linha horizontal para baixo pela metade do eixo vertical, logo abaixo do nível de similaridade de aproximadamente 41.

Etapa 3: Examinar a partição final

Depois de determinar os agrupamentos finais na etapa 2, repita a análise e especifique o número de agrupamentos (ou o nível de similaridade) para a partição final. O Minitab exibe a tabela da partição final, que mostra as características de cada agrupamento na partição final. Por exemplo, a distância média do centróide fornece uma medida da variabilidade das observações dentro de cada agrupamento.

Examine os agrupamentos na partição final para determinar se o agrupamento parece lógico para a aplicação. Se você ainda não tiver certeza, pode repetir a análise e comparar os dendrogramas para agrupamentos finais diferentes, para decidir qual agrupamento final é o mais lógico para os dados.
Observação

Para obter mais informações sobre essas estatísticas, vá para Partição final.

Partição Final Dentro da soma de quadrados Distância Distância Número de do média do máxima do observações agrupado centróide centróide Agrupado1 7 3,25713 0,612540 1,12081 Agrupado2 7 2,72247 0,581390 0,95186 Agrupado3 3 0,55977 0,398964 0,54907 Agrupado4 3 0,37116 0,326533 0,48848
Centróides do grupo Centróide Variável Agrupado1 Agrupado2 Agrupado3 Agrupado4 global Gênero 0,97468 -0,97468 0,97468 -0,97468 -0,0000000 Altura -1,00352 1,01283 -0,37277 0,35105 0,0000000 Peso -0,90672 0,93927 -0,86797 0,79203 -0,0000000 Lateralidade 0,63808 0,63808 -1,48885 -1,48885 0,0000000
Distâncias Entre Centróides do Grupo Agrupado1 Agrupado2 Agrupado3 Agrupado4 Agrupado1 0,00000 3,35759 2,21882 3,61171 Agrupado2 3,35759 0,00000 3,67557 2,23236 Agrupado3 2,21882 3,67557 0,00000 2,66074 Agrupado4 3,61171 2,23236 2,66074 0,00000

Dendrograma

Principais resultados: Partição final, dendrograma

Este dendrograma foi criado usando-se uma partição final de 4 agrupamentos, que ocorre em um nível de similaridade de aproximadamente 40. O primeiro agrupamento (extrema esquerda) é composto de sete observações (as observações nas linhas 1, 3, 6, 9, 10, 11 e 15 da worksheet). O segundo agrupamento, diretamente à direita, é composto de 3 observações (as observações nas linhas 4, 12 e 19 da worksheet). O terceiro agrupamento é composto de 7 observações (as observações nas linhas 2, 14, 17, 20, 18, 5 e 8). O quarto cluster, na extrema direita, é composto de 3 observações (as observações nas linhas 7, 13 e 16). Se você cortar o dendrograma mais alto, haveria menos agrupamentos finais, mas o nível de similaridade seria menor. Se você cortar o dendrograma mais baixo, o nível de similaridade seria maior, mas haveria mais agrupamentos finais.

Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política