Interpretar os principais resultados para Análise de correspondência simples

Conclua as etapas a seguir para interpretar uma análise de correspondência simples. A saída principal inclui componentes principais, inércia, proporção da inércia, qualidade, massa e diversos gráficos.

Etapa 1: Determinar o número de componentes principais

Use a proporção de inércia para determinar o número mínimo de componentes principais, também chamados de eixos principais, que respondem pela maioria do desvio dos valores esperados nos dados. Retenha os componentes principais que explicam um proporção aceitável da inércia total. O nível aceitável depende da sua aplicação. Idealmente, o primeiro, dois ou três componentes respondem pela maior parte da inércia total.

Se o número mínimo de componentes principais necessários não correspondem ao número de componentes que você inseriu para a análise, repita a análise usando o número adequado de componentes.

Análise da Tabela de Contingência

EixoInérciaProporçãoAcumulado
10,03910,47200,4720
20,03040,36660,8385
30,01090,13110,9697
40,00250,03031,0000
Total0,0829   
Principais resultados: Eixos, Proporção, Acumulada

Esses resultados mostram a decomposição da inércia total de uma tabela de contingência 10 x 5 em 4 componentes (eixos). A inércia total explicada pelos quatro componentes é 0,0829. Da inércia total, o primeiro componente responde por 47,2% da inércia (Proporção = 0,4720) e o segundo componente responde por 36,66% da inércia (Proporção = 0,3666). Juntos, esses 2 componentes respondem por 83,85% da inércia total (Acumulada = 0,8385). Portanto, especificar 2 componentes para a análise pode ser suficiente.

Etapa 2: Interpretar os componentes principais

Use os valores de qualidade para determinar a proporção de inércia da linha ou de inércia da coluna representada pelos componentes. A qualidade é sempre um número entre 0 e 1. Valores maiores da qualidade indicam que a linha ou a coluna é bem representada pelos componentes. Valores menores indicam representação inferior. Os valores da qualidade para linhas e colunas podem ajudá-lo a interpretar os componentes.

Use os valores de contribuição das linhas e/ou colunas para avaliar quais categorias de coluna e de linha contribuem mais para a inércia de cada componente. Use um gráfico de linhas ou de colunas para interpretar visualmente os componentes.

Contribuições de Linha






Componente 1Componente 2
IDNomeQualMassaInerteCoordCorrContrCoordCorrContr
1Geologia0,9160,1070,137-0,0760,0550,016-0,3030,8610,322
2Bioquímica0,8810,0360,119-0,1800,1190,0300,4550,7620,248
3Química0,6440,1630,021-0,0380,1340,006-0,0730,5100,029
4Zoologia0,9290,1510,2300,3270,8460,413-0,1020,0830,052
5Física0,8860,1430,196-0,3160,8800,365-0,0270,0060,003
6Engenharia0,8700,1110,1520,1170,1210,0390,2920,7490,310
7Microbiologia0,6800,0460,010-0,0130,0090,0000,1100,6710,018
8Botânica0,6540,1080,0670,1790,6250,0880,0390,0290,005
9Estatística0,5610,0360,012-0,1250,5540,014-0,0140,0070,000
10Matemática0,3190,0980,056-0,1070,2400,0290,0610,0790,012
Principais resultados: Qual, Contr, Gráfico de linhas/colunas

Nesta análise, o Minitab calcula dois principais componentes. Na tabela Contribuições da linha, os valores de qualidade superiores ocorrem para Zoologia (0,929) e Geologia (0,916). Portanto, essas duas categorias são melhores representadas pelos dois componentes. A Matemática tem a representação inferior, com um valor da qualidade de 0,319.

Zoologia (0,413) e Física (0,365) contribuem o máximo para a inércia do Componente 1. Geologia (0,322), Engenharia (0,310) e Bioquímica (0,248) contribuem o máximo para a inércia do Componente 2.

Este gráfico de linhas mostra as coordenadas principais das linhas. O componente 1, que explica melhor a Zoologia e a Física, mostra esses dois campos mais distantes da origem, mas com sinais opostos. Portanto, o componente 1 contrasta as ciências biológicas Zoologia e Botânica com Física. O componente 2 contrasta Bioquímica e Engenharia com Geologia.

Etapa 3: Examinar as relações entre categorias

Examinar os valores de inércia calculados para as categorias de linhas e de colunas. As categorias com associações mais fortes têm um valor de inércia mais alto, que indica que elas contribuem mais para o valor qui-quadrado total.

Você também pode usar um gráfico de linha ou coluna assimétrica para examinar visualmente possíveis relações. Para um gráfico de linhas, quanto mais perto um perfil de linha estiver de um vértice de coluna, maior é o perfil da linha com respeito à categoria de coluna. Para um gráfico de coluna, quanto mais perto um perfil de coluna estiver de um vértice de linha, maior é o perfil da coluna com respeito à categoria de coluna.

Contribuições de Linha






Componente 1Componente 2
IDNomeQualMassaInerteCoordCorrContrCoordCorrContr
1Geologia0,9160,1070,137-0,0760,0550,016-0,3030,8610,322
2Bioquímica0,8810,0360,119-0,1800,1190,0300,4550,7620,248
3Química0,6440,1630,021-0,0380,1340,006-0,0730,5100,029
4Zoologia0,9290,1510,2300,3270,8460,413-0,1020,0830,052
5Física0,8860,1430,196-0,3160,8800,365-0,0270,0060,003
6Engenharia0,8700,1110,1520,1170,1210,0390,2920,7490,310
7Microbiologia0,6800,0460,010-0,0130,0090,0000,1100,6710,018
8Botânica0,6540,1080,0670,1790,6250,0880,0390,0290,005
9Estatística0,5610,0360,012-0,1250,5540,014-0,0140,0070,000
10Matemática0,3190,0980,056-0,1070,2400,0290,0610,0790,012
Resultados principais: Inerte, gráfico Linha/coluna assimétrica

Na tabela Contribuições da linha, a coluna rotulada Inerte é a proporção da inércia total contribuída por cada linha. Assim, a Geologia contribui com 13,7% para a estatística qui-quadrado total. A Zoologia tem o mais alto valor de inércia (0,23). Portanto, a Zoologia contribui com 23% do valor qui-quadrado total e tem uma associação mais forte com as categorias de coluna (financiamento) do que as outras categorias de linha.

Neste gráfico de linhas assimétricas, os pontos de linha representam disciplinas acadêmicas e os pontos de coluna representam níveis de financiamento (A é o mais alto nível de financiamento e D é o mais baixo. E indica nenhum financiamento). A Bioquímica está mais perto da categoria de coluna E, o que significa que a bioquímica como uma disciplina tem a maior porcentagem de pesquisadores não financiados neste estudo.