Interpretar os principais resultados para Agrupamento de observações

Conclua as etapas a seguir para interpretar uma análise de agrupamentos de observações. A saída principal inclui valores de similaridade e de distância, o dendrograma e a partição final.

Etapa 1: Examinar os níveis de similaridade e de distância

Em cada passo no processo de amalgamação, exiba os agrupamentos que são formados e examine os níveis de similaridade e de distância. Quanto maior o nível de similaridade, mais similares as observações estão em cada agrupamento. Quanto menor o nível de distância, mais próximas as observações estão em cada agrupamento.

Idealmente, os agrupamentos devem ter um nível de similaridade relativamente alto e um nível de distância relativamente baixo. Contudo, você deve equilibrar aquela meta com a existência de um número prático e razoável de agrupamentos.

Passos de Amalgamação

PassoNúmero de
agrupados
Nível de
similaridade
Nível de
distância
Agrupados
reunidos
Novo
agrupado
Número de
obs. no
novo
agrupado
11996,60050,162751316132
21895,46420,217151720172
31795,26480,226696962
41692,91780,339051718173
51590,52960,453391115112
61490,31240,463781219122
71388,24310,5628521422
81288,24310,562855852
91185,97440,6714661063
101083,06390,8108071373
11983,06390,810801312
12881,40390,8902721725
13779,81850,9661761165
14678,75341,0171641243
15566,21121,617602527
16462,00361,819041617
17341,04742,8222914110
18240,17182,8642127210
1910,00004,7873912120
Principais resultados: Nível de similaridade, Nível de distância

Nesses resultados, os dados contêm um total de 20 observações. Na etapa 1, dois agrupamentos (observações 13 e 16 na worksheet) são unidos para formar um novo agrupamento. Essa etapa cria 19 agrupamentos nos dados, com um nível de similaridade de 96,6005 e um nível de distância de 0,16275. Apesar de o nível de similaridade ser alto e o nível de distância ser baixo, o número de agrupamentos é muito alto para ser útil. Em cada passo subsequente, conforme novos agrupamentos são formados, o nível de similaridade diminui e o nível de distância aumenta. No passo final, todas as observações são unidas em um agrupamento único.

Para exibir os níveis de similaridade no dendrograma, mantenha o ponteiro sobre uma linha horizontal no diagrama de árvore, no Minitab.

Etapa 2: Determinar os agrupamentos finais dos seus dados

Use o nível de similaridade para os agrupamentos que estão unidos em cada passo para ajudar a determinar os agrupamentos finais dos dados.Procure uma mudança abrupta no nível de similaridade entre passos. O passo que precede a mudança abrupta na similaridade pode fornecer um bom ponto de corte para a partição final. Para a partição final, os agrupamentos devem ter um nível de similaridade razoavelmente altos. Você deve usar também seu conhecimento prático dos dados para determinar os agrupamentos finais que fazem mais sentido para sua aplicação.

Por exemplo, a seguinte tabela de amalgamação mostra que o nível de similaridade diminui pelos incrementos de aproximadamente 3 ou menos até o passo 15. A similaridade diminui em mais de 20 (de 62,0036 a 41,0474) nos passos 16 e 17, quando o número de agrupamentos muda de 4 para 3. Esses resultados indicam que 4 agrupamentos podem ser suficientes para a partição final. Se este agrupamento fizer sentido intuitivo, ele é provavelmente uma boa escolha.

Passos de Amalgamação

PassoNúmero de
agrupados
Nível de
similaridade
Nível de
distância
Agrupados
reunidos
Novo
agrupado
Número de
obs. no
novo
agrupado
11996,60050,162751316132
21895,46420,217151720172
31795,26480,226696962
41692,91780,339051718173
51590,52960,453391115112
61490,31240,463781219122
71388,24310,5628521422
81288,24310,562855852
91185,97440,6714661063
101083,06390,8108071373
11983,06390,810801312
12881,40390,8902721725
13779,81850,9661761165
14678,75341,0171641243
15566,21121,617602527
16462,00361,819041617
17341,04742,8222914110
18240,17182,8642127210
1910,00004,7873912120
Principais resultados: Nível de similaridade, número de agrupamentos

A decisão sobre o agrupamento final também é chamado corte do dendrograma. O corte do dendrograma é similar ao desenho de uma linha horizontal por todo o dendrograma para especificar o agrupamento final. Por exemplo, para cortar este dendrograma em quatro agrupamentos, imagina desenhar uma linha horizontal para baixo pela metade do eixo vertical, logo abaixo do nível de similaridade de aproximadamente 41.

Etapa 3: Examinar a partição final

Depois de determinar os agrupamentos finais na etapa 2, repita a análise e especifique o número de agrupamentos (ou o nível de similaridade) para a partição final. O Minitab exibe a tabela da partição final, que mostra as características de cada agrupamento na partição final. Por exemplo, a distância média do centróide fornece uma medida da variabilidade das observações dentro de cada agrupamento.

Examine os agrupamentos na partição final para determinar se o agrupamento parece lógico para a aplicação. Se você ainda não tiver certeza, pode repetir a análise e comparar os dendrogramas para agrupamentos finais diferentes, para decidir qual agrupamento final é o mais lógico para os dados.
Observação

Para obter mais informações sobre essas estatísticas, vá para Partição final.

Partição Final

Número de
observações
Dentro da
soma de
quadrados
do
agrupado
Distância
média do
centróide
Distância
máxima do
centróide
Agrupado173,257130,6125401,12081
Agrupado272,722470,5813900,95186
Agrupado330,559770,3989640,54907
Agrupado430,371160,3265330,48848

Centróides do grupo

VariávelAgrupado1Agrupado2Agrupado3Agrupado4Centróide
global
Gênero0,97468-0,974680,97468-0,97468-0,0000000
Altura-1,003521,01283-0,372770,351050,0000000
Peso-0,906720,93927-0,867970,79203-0,0000000
Lateralidade0,638080,63808-1,48885-1,488850,0000000

Distâncias Entre Centróides do Grupo

Agrupado1Agrupado2Agrupado3Agrupado4
Agrupado10,000003,357592,218823,61171
Agrupado23,357590,000003,675572,23236
Agrupado32,218823,675570,000002,66074
Agrupado43,611712,232362,660740,00000
Principais resultados: Partição final, dendrograma

Este dendrograma foi criado usando-se uma partição final de 4 agrupamentos, que ocorre em um nível de similaridade de aproximadamente 40. O primeiro agrupamento (extrema esquerda) é composto de sete observações (as observações nas linhas 1, 3, 6, 9, 10, 11 e 15 da worksheet). O segundo agrupamento, diretamente à direita, é composto de 3 observações (as observações nas linhas 4, 12 e 19 da worksheet). O terceiro agrupamento é composto de 7 observações (as observações nas linhas 2, 14, 17, 20, 18, 5 e 8). O quarto cluster, na extrema direita, é composto de 3 observações (as observações nas linhas 7, 13 e 16). Se você cortar o dendrograma mais alto, haveria menos agrupamentos finais, mas o nível de similaridade seria menor. Se você cortar o dendrograma mais baixo, o nível de similaridade seria maior, mas haveria mais agrupamentos finais.