Interpretar todas as estatísticas e gráficos para Agrupamento de K médias

Encontre definições e orientações de interpretação para cada estatística e gráfico fornecido com a análise de agrupamento de k-médias.

Número de observações

O número de observações em cada agrupamento na partição final.

Interpretação

Examine o número de observações em cada agrupamento quando você interpretar as medidas de variabilidade, como a distância média e a soma dos quadrados dentro de cada agrupamento. A variabilidade de um agrupamento pode ser afetada por ter um número maior ou menor de observações. Por exemplo, a soma dos quadrados dentro de cada agrupamento torna-se maior conforme mais observações são adicionadas.

Examine os agrupamentos que têm significativamente menos observações do que outros agrupamentos. Os agrupamentos que têm muito poucas observações podem conter outliers ou observações atípicas com características únicas.

Dentro da soma dos quadrados do agrupamento

A soma dos desvios quadráticos de cada observação e do centroide do agrupamento.

Interpretação

A soma dos quadrados dentro do agrupamento é uma medida da variabilidade das observações dentro de cada agrupamento. Em geral, um agrupamento que tem uma pequena soma dos quadrados é mais compacto do que um agrupamento que tem uma grande soma de quadrados. Os agrupamentos que têm valores maiores exibem maior variabilidade de observações dentro do agrupamento.

Contudo, similar às somas dos quadrados e à média dos quadrados na ANOVA, a soma dos quadrados dentro do agrupamento é influenciada pelo número de observações. Como o número de observações aumenta, a soma dos quadrados torna-se maior. Portanto, a soma dos quadrados dentro do agrupamento é geralmente não diretamente comparável entre agrupamentos com diferentes números de observações. Para comprar a variabilidade dentro do agrupamento, em vez disso, use a distância média do centroide.

Distância média do centroide

A média das distâncias das observações até o centroide de cada agrupamento.

Interpretação

A distância média das observações até o centroide do agrupamento é uma medida da variabilidade das observações dentro de cada agrupamento. Em geral, um agrupamento que tem uma distância média menor é mais compacto do que um agrupamento que tem uma distância média maior. Os agrupamentos que têm valores maiores exibem maior variabilidade de observações dentro do agrupamento.

Máxima distância do centroide

O máximo das distâncias das observações até o centroide de cada agrupamento.

Interpretação

A distância máxima das observações até o centroide do agrupamento é uma medida da variabilidade das observações dentro de cada agrupamento. Um valor máximo mais alto, especialmente em relação à distância média, indica uma observação no agrupamento que reside mais distante do centroide do agrupamento.

Centróide de agrupamento

O meio de um agrupamento. Um centróide é um vetor que contém um número para cada variável, onde cada número é a média de uma variável para as observações naquele agrupamento. O centróide pode ser entendido como a média multidimensional do agrupamento.

Interpretação

Use o centróide de agrupamento como uma medida geral do local do agrupamento e para ajudar a interpretar cada cluster. Cada centróide pode ser visto como representando a "observação média" dentro de um agrupamento entre todas as variáveis na análise.

O Minitab calcula as distâncias entre os centróides dos agrupamentos que são incluídos na partição final. Para cada agrupamento, o Minitab também calcula diversas medidas de distâncias entre o centróide do agrupamento e as observações dentro do agrupamento. Para obter mais informações, consulte o tópico para cada medida da distância.

Grande centróide

O grande centróide é um vetor de médias variáveis de todas as observações.

Distâncias entre centróides do agrupamento

As distâncias entre centróides do agrupamento medem quão distantes os centróides dos agrupamentos na partição final estão uns dos outros.

Interpretação

Apesar dos valores de distância não serem muito informativos por si mesmos, você pode comparar as distâncias para ver quão diferentes os agrupamentos estão um do outro. Uma distância maior geralmente indica uma maior diferença entre os agrupamentos.