Exemplo de Análise de correspondência simples

Um gerente de pesquisa da universidade quer determinar como dez disciplinas acadêmicas se comparam entre si, em relação a cinco diferentes categorias de financiamento. O gerente coleta dados de classificação com 2 fatores para 796 pesquisadores.

Para esta classificação com dois fatores, as disciplinas acadêmicas são linhas e as categorias de financiamento são colunas. A é a categoria de financiamento superior, D é a inferior, e a categoria E não tem financiamento. O gerente realiza uma análise de correspondência simples para representar as associações entre linhas e colunas.

O gerente também quer examinar os dados suplementares não incluídos no conjunto de dados principal. Os dados suplementares incluem uma linha adicional para pesquisadores do museu e uma linha para ciências matemáticas, que é a soma de Matemática e Estatística.

  1. Abra o conjunto de dados amostrais, FinancPesquisa.MTW.
  2. Selecione Estat > Multivariada > Análise de correspondência simples.
  3. Em Dados de Entrada, selecione Colunas de tabela de contingência e insira CT1-CT5. Em Nomes de linha, insira NomesLin. Em Nomes de colunas, insira NomesCol.
  4. Clique em Resultados e selecione Perfis de Linha. Clique em OK.
  5. Clique em Dados adicionais. Em Linhas Adicionais, insira SupLin1SupLin2. Em Nomes de linha, insira NomesRS. Clique em OK.
  6. Clique em Gráficos. Selecione Exibir pontos adicionais em todos os gráficos. Selecione Gráfico de simetria que exibe somente linhas e Gráfico de linha assimétrico mostrando linhas e colunas.
  7. Clique em OK em cada caixa de diálogo.

Interpretar os resultados

A tabela Perfis de linha mostra as proporções de cada categoria de linha por coluna. Por exemplo, para Geologia, 3,5% dos pesquisadores estão na categoria de financiamento A, 22,4% estão na categoria de financiamento B, e assim por diante. A massa de cada linha indica proporção de pesquisadores em todo o conjunto de dados. Por exemplo, a massa de Geologia é 0,107, que indica que 10,7% dos pesquisadores estão no campo da Geologia.

Você pode usar os valores nas tabelas Contribuições de linha e Contribuições de coluna para interpretar os diferentes componentes. A coluna, rotulada Qual ou qualidade, indica a proporção da inércia representada pelos dois componentes.

Por exemplo, para as contribuições de linha, os campos Zoologia (0,929) e Geologia (0,916) são representados de melhor forma, entre os campos, pela análise dos dois componentes. A Matemática tem a pior representação, com um valor da qualidade de 0,319. Para as contribuições de coluna, os dois componentes explicam a maior parte da variabilidade nas categorias de financiamento B, D e E. As categorias de financiamento A, B, C e D contribuem mais para o componente 1, enquanto a categoria sem financiamento, E, contribui mais para o componente 2.

Este gráfico de linhas mostra as coordenadas principais das linhas. O componente 1, que explica melhor a Zoologia e a Física, mostra esses dois campos mais distantes da origem, mas com sinais opostos. Portanto, o componente 1 contrasta as ciências biológicas Zoologia e Botânica com Física. O componente 2 contrasta Bioquímica e Engenharia com Geologia.

No gráfico de linhas assimétricas, as linhas são escaladas nas coordenadas principais e as colunas são escaladas em coordenadas padrão. Dentre as classes de financiamento, o componente 1 contrasta os níveis de financiamento enquanto o componente 2 contrasta ser financiado (A a D) com não ser financiado (E). Dentre as disciplinas, a Física tende a ter o nível de financiamento mais alto e Zoologia o mais baixo. A Bioquímica tende a estar no meio do nível de financiamento, mas é a superior entre os pesquisadores sem financiamento. Os museus tendem a ser financiados, mas em um nível inferior do que aquele dos pesquisadores acadêmicos.

Perfis de Linha

ABCDEMassa
Geologia0,0350,2240,4590,1650,1180,107
Bioquímica0,0340,0690,4480,0340,4140,036
Química0,0460,1920,3770,1620,2230,163
Zoologia0,0250,1250,3420,2920,2170,151
Física0,0880,1930,4120,0790,2280,143
Engenharia0,0340,1250,2840,1700,3860,111
Microbiologia0,0270,1620,3780,1350,2970,046
Botânica0,0000,1400,3950,1980,2670,108
Estatística0,0690,1720,3790,1380,2410,036
Matemática0,0260,1410,4740,1030,2560,098
Massa0,0390,1610,3890,1620,249 

Análise da Tabela de Contingência

EixoInérciaProporçãoAcumulado
10,03910,47200,4720
20,03040,36660,8385
30,01090,13110,9697
40,00250,03031,0000
Total0,0829   

Contribuições de Linha






Componente 1Componente 2
IDNomeQualMassaInerteCoordCorrContrCoordCorrContr
1Geologia0,9160,1070,137-0,0760,0550,016-0,3030,8610,322
2Bioquímica0,8810,0360,119-0,1800,1190,0300,4550,7620,248
3Química0,6440,1630,021-0,0380,1340,006-0,0730,5100,029
4Zoologia0,9290,1510,2300,3270,8460,413-0,1020,0830,052
5Física0,8860,1430,196-0,3160,8800,365-0,0270,0060,003
6Engenharia0,8700,1110,1520,1170,1210,0390,2920,7490,310
7Microbiologia0,6800,0460,010-0,0130,0090,0000,1100,6710,018
8Botânica0,6540,1080,0670,1790,6250,0880,0390,0290,005
9Estatística0,5610,0360,012-0,1250,5540,014-0,0140,0070,000
10Matemática0,3190,0980,056-0,1070,2400,0290,0610,0790,012

Linhas Adicionais






Componente 1Componente 2
IDNomeQualMassaInerteCoordCorrContrCoordCorrContr
1Museus0,5560,0670,3530,3140,2250,168-0,3810,3310,318
2MathSci0,5590,1340,041-0,1120,4930,0430,0410,0660,007

Contribuições de Coluna






Componente 1Componente 2
IDNomeQualMassaInerteCoordCorrContrCoordCorrContr
1A0,5870,0390,187-0,4780,5740,228-0,0720,0130,007
2B0,8160,1610,110-0,1270,2860,067-0,1730,5310,159
3C0,4650,3890,094-0,0830,3410,068-0,0500,1240,032
4D0,9680,1620,3470,3900,8590,632-0,1390,1090,103
5E0,9900,2490,2620,0320,0120,0060,2920,9780,699