Interpretar os principais resultados para Agrupamento de variáveis

Conclua as etapas a seguir para interpretar uma análise de variáveis de agrupamento. A saída principal inclui valores de similaridade e de distância, o dendrograma e a partição final.

Etapa 1: Examinar os níveis de similaridade e de distância

Em cada passo no processo de amalgamação, exiba os agrupamentos formados e examine os níveis de similaridade e de distância. Quanto maior o nível de similaridade, mais similares (correlacionadas) as variáveis estão em cada agrupamento. Quanto menor o nível de distância, mais próximas as variáveis estão em cada agrupamento.

Idealmente, os agrupamentos devem ter um nível de similaridade relativamente alto e um nível de distância relativamente baixo. Contudo, você deve equilibrar aquela meta com a existência de um número prático e razoável de agrupamentos.

Distância do Coeficiente de Correlação, Ligação Média

Passos de Amalgamação

PassoNúmero de
agrupados
Nível de
similaridade
Nível de
distância
Agrupados
reunidos
Novo
agrupado
Número de
obs. no
novo
agrupado
1493,96660,1206692322
2393,15480,1369044542
3287,31500,2537001413
4179,81130,4037751215
Principais resultados: Nível de similaridade, Nível de distância

Nesses resultados, os dados contêm um total de 5 variáveis. Na etapa 1, dois agrupamentos (variáveis 2 e 3 na worksheet) são unidos para formar um novo agrupamento. Isso cria 4 agrupamentos nos dados, com um nível de similaridade de 93,9666 e um nível de distância de 0,130669. Apesar do nível de similaridade ser alto e o nível de distância ser baixo, o número de agrupamentos é muito alto para ser útil. Em cada passo subsequente, conforme novos agrupamentos são formados, o nível de similaridade diminui e o nível de distância aumenta. No passo final, todas as variáveis estão unidas em um único agrupamento.

Para exibir os níveis de similaridade no dendrograma, mantenha o ponteiro sobre uma linha horizontal no diagrama de árvore, no Minitab.

Etapa 2: Determinar os agrupamentos finais dos seus dados

Use o nível de similaridade para os agrupamentos que estão unidos em cada passo para ajudar a determinar os agrupamentos finais dos dados.Procure uma mudança abrupta no nível de similaridade entre passos. O passo que precede a mudança abrupta na similaridade pode fornecer um bom ponto de corte para a partição final. Para a partição final, os agrupamentos devem ter um nível de similaridade razoavelmente altos. Você deve usar também seu conhecimento prático dos dados para determinar os agrupamentos finais que fazem mais sentido para sua aplicação.

Por exemplo, a seguinte tabela de amalgamação mostra que o nível de similaridade diminui ligeiramente do passo 1 (93,9666) para o passo (93,1548). A similaridade diminui mais abruptamente no passo 3 (87,315), quando o número de agrupamentos muda de 3 para 2. Esses resultados indicam que 3 agrupamentos podem ser apropriados para a partição final. Se este agrupamento fizer sentido intuitivo, ele é provavelmente uma boa escolha.

Distância do Coeficiente de Correlação, Ligação Média

Passos de Amalgamação

PassoNúmero de
agrupados
Nível de
similaridade
Nível de
distância
Agrupados
reunidos
Novo
agrupado
Número de
obs. no
novo
agrupado
1493,96660,1206692322
2393,15480,1369044542
3287,31500,2537001413
4179,81130,4037751215
Principais resultados: Nível de similaridade, número de agrupamentos

A decisão sobre o agrupamento final também é chamada corte do dendrograma. O corte do dendrograma é parecido com o desenho de uma linha horizontal por todo o dendrograma para especificar o agrupamento final. Por exemplo, para cortar este dendrograma em quatro agrupamentos, imagine desenhar uma linha horizontal para baixo pela metade do eixo vertical, logo abaixo do nível de similaridade de aproximadamente 88.

Etapa 3: Examinar a partição final

Depois de determinar os agrupamentos finais na etapa 2, repita a análise e especifique o número de agrupamentos (ou o nível de similaridade) para a partição final. O Minitab exibe a tabela da partição final, que mostra as variáveis que formam cada agrupamento na partição final.

Examine os agrupamentos na partição final para determinar se o agrupamento parece lógico para a aplicação. Se você ainda não tiver certeza, pode repetir a análise e comparar os dendrogramas para agrupamentos finais diferentes, para ajudá-lo a decidir qual é mais lógico para os dados.

Distância do Coeficiente de Correlação, Ligação Média

Passos de Amalgamação

PassoNúmero de
agrupados
Nível de
similaridade
Nível de
distância
Agrupados
reunidos
Novo
agrupado
Número de
obs. no
novo
agrupado
1493,96660,1206692322
2393,15480,1369044542
3287,31500,2537001413
4179,81130,4037751215

Partição Final

Variáveis
Agrupamento 1  Jornal
Agrupamento 2  Rádios  Aparelhos de TV
Agrupamento 3  Taxa de alfabetização  Universidade
Principais resultados: Partição final, dendrograma

Nesses resultados, os três agrupamentos são formados na partição final:

  • Números de cópias de jornal por 1.000 pessoas
  • Número de aparelhos de rádio e televisão
  • Nível de alfabetização e se uma universidade está localizada na cidade
Este agrupamento parece razoável.

Este dendrograma foi criado usando-se uma partição final de 3 agrupamentos. Cada agrupamento final é indicado por uma cor separada. O dendrograma foi "cortado" em um nível de similaridade de aproximadamente 88. Se o dendrograma tiver sido cortado mais alto, haveria menos agrupamentos finais, mas o nível de similaridade teria sido reduzido. Se você cortar o dendrograma mais baixo, o nível de similaridade teria sido maior, mas haveria mais agrupamentos finais.