Considerações de dados para Agrupamento de variáveis

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes ao coletar dados, realizar a análise, e interpretar os resultados.

Você pode ter dados brutos ou uma matriz de distâncias

Normalmente, você usa dados brutos para esta análise. Cada linha contém medições sobre um assunto ou item único. Você deve ter duas ou mais colunas numéricas, com cada coluna representando uma medição diferente. Você deve deletar linhas com dados faltantes da worksheet antes de usar esta análise.

Se você armazena uma matriz de distância p x p, onde p é o número de variáveis, é possível usar a matriz para a análise. A entrada (i, j) na matriz é a distância entre as variáveis i e j. Se você usar uma matriz de distância, o Minitab não poderá calcular estatísticas para a partição final.

Os dados devem ser numéricos
Para formar os agrupamentos, esta análise calcula a distância entre as variáveis, que não pode ser medida entre os níveis de uma variável categórica. Para usar uma variável categórica na análise, você deve, primeiro, converter os valores de texto para uma escala numérica. Por exemplo, um analista mede a satisfação do cliente usando as categorias "Muito satisfeito", "Satisfeito", "Insatisfeito" e "Muito insatisfeito". Para realizar variáveis de agrupamento, o analista recodifica essas categorias como +2, +1, −1 , −2. As distâncias entre as variáveis agora pode ser calculada para a análise. Alternativamente, você pode dividir a worksheet em worksheets separadas para cada nível da variável categórica e agrupamento de variáveis em cada nível. Para obter mais informações sobre como dividir a worksheet, acesse Visão geral para Dividir a Worksheet.