Frequências e distâncias qui-quadrado para Análise de correspondência simples

Encontre definições e interpretação para cada estatística que é fornecida para frequências e distâncias qui-quadrado para análise de correspondência simples.

Tabela de contingência

A tabela de contingência calcula observações de acordo com múltiplas variáveis categóricas. As linhas e colunas da tabela correspondem a essas variáveis categóricas. A tabela também inclui totais marginais para cada nível das variáveis.

A tabela de contingência para análise de correspondência simples é uma tabela de dois fatores que calcula observações para duas variáveis. Você também pode categorizar observações para três ou quatro variáveis usando a subcaixa de diálogo Combinar para cruzar as variáveis e criar as linhas e/ou colunas de uma tabela de dois fatores.

Interpretação

Use a tabela de contingência para exibir a frequência observadas para cada célula definida por uma categoria de linha e uma categoria de coluna. Use a coluna e totais de linha para ver a frequência total de cada categoria.

Tabela de Contingência

ABCDETotal
Geologia3,00019,00039,00014,00010,00085,000
Bioquímica1,0002,00013,0001,00012,00029,000
Química6,00025,00049,00021,00029,000130,000
Zoologia3,00015,00041,00035,00026,000120,000
Física10,00022,00047,0009,00026,000114,000
Engenharia3,00011,00025,00015,00034,00088,000
Microbiologia1,0006,00014,0005,00011,00037,000
Botânica0,00012,00034,00017,00023,00086,000
Estatística2,0005,00011,0004,0007,00029,000
Matemática2,00011,00037,0008,00020,00078,000
Total31,000128,000310,000129,000198,000796,000

A tabela de contingência de dois fatores a seguir mostra as contagens observadas de pesquisadores em cada disciplina acadêmica e na categoria financiamento (A, B, C, D, E). A coluna Total indica que a maioria dos pesquisadores estão nos campos da Química (130), Zoologia (120) e Física (114). A linha Total indica que a maioria dos pesquisadores estão classificados sob a categoria de financiamento C (310). Para as contagens de células, os pesquisadores em Química, que são classificados na categoria de financiamento C, têm a mais alta frequência observada (49).

Frequências esperadas

A frequência esperada é a contagem das observações que se esperaria em uma célula, em média, se as variáveis fossem independentes. O Minitab calcula as contagens esperadas como o produto dos totais de linhas e colunas dividido pelo número total de observações.

Frequências Esperadas

ABCDE
Geologia3,31013,66833,10313,77521,143
Bioquímica1,1294,66311,2944,7007,214
Química5,06320,90550,62821,06832,337
Zoologia4,67319,29646,73419,44729,849
Física4,44018,33244,39718,47528,357
Engenharia3,42714,15134,27114,26121,889
Microbiologia1,4415,95014,4105,9969,204
Botânica3,34913,82933,49213,93721,392
Estatística1,1294,66311,2944,7007,214
Matemática3,03812,54330,37712,64119,402

A tabela de frequência esperada a seguir mostra as contagens esperadas de pesquisadores em cada disciplina acadêmica e categoria de financiamento (A, B, C, D, E), supondo-se que a relação entre financiamento e disciplina acadêmica é independente. Como a maioria dos pesquisadores está em Química e a maioria dos departamentos está no financiamento da categoria C, a combinação dessas categorias tem o mais alto valor esperado (aproximadamente 51).

Observado – Frequências esperadas

O observado − frequências esperadas é a diferença entre a contagem das observações reais na célula e a contagem das observações na célula que você espera, se as variáveis forem independentes.

Interpretação

Use a diferença entre as frequências observadas e esperadas para procurar evidências das possíveis associações nos dados. Se houver duas variáveis associadas, a distribuição de observações de uma variável irá diferir de acordo com a categoria da segunda variável. Como resultado, a magnitude da diferença entre a frequência observada e a frequência esperada é relativamente grande. Se as duas variáveis forem independentes, a distribuição das observações de uma variável é semelhante para todas as categorias da segunda variável. Como resultado, a magnitude da diferença entre a frequência observada e a frequência esperada é relativamente pequena.

Frequências Observadas - Esperadas

ABCDE
Geologia-0,3105,3325,8970,225-11,143
Bioquímica-0,129-2,6631,706-3,7004,786
Química0,9374,095-1,628-0,068-3,337
Zoologia-1,673-4,296-5,73415,553-3,849
Física5,5603,6682,603-9,475-2,357
Engenharia-0,427-3,151-9,2710,73912,111
Microbiologia-0,4410,050-0,410-0,9961,796
Botânica-3,349-1,8290,5083,0631,608
Estatística0,8710,337-0,294-0,700-0,214
Matemática-1,038-1,5436,623-4,6410,598

Nessa tabela, a magnitude da diferença entre a contagem observada e a contagem esperada é relativamente grande para Zoologia e a categoria de financiamento D (15,553) e para Engenharia e para a categoria de financiamento E (12,111). Para essas células, as contagens observadas são maiores do que a contagem que você esperaria se as variáveis forem independentes. A magnitude da diferença também é relativamente grande para Geologia e para a categoria de financiamento E (-11,143). Para esta célula, a contagem observada é menor do que a contagem que você esperaria se as variáveis fossem independentes. Portanto, você pode concluir que consideravelmente mais departamentos de engenharia não foram financiados do que o esperado, e consideravelmente menos departamentos de geologia não foram financiados do que o esperado.

Distâncias qui-quadrado

O Minitab exibe a contribuição de cada célula para a estatística qui-quadrado, como a distância qui-quadrado. A distância qui-quadrado de cada célula estabelece o quanto da estatística total de qui-quadrado é atribuível à divergência de cada célula.

O Minitab calcula a contribuição de cada célula para a estatística qui-quadrado como o quadrado da diferença entre os valores observados e esperados para uma célula, dividido pelo valor esperado para essa célula. O qui-quadrado total é a soma dos valores para todas as células.

Interpretação

Você pode comparar as distâncias qui-quadrado de cada célula para avaliar quais células contribuem mais para o qui-quadrado total. Se as frequências das células observadas e esperadas diferir muito, o valor qui-quadrado da célula é maior. Portanto, uma distância qui-quadrado maior em uma célula sugere uma associação mais forte entre as categorias de linha e de coluna do que é esperado por chance.

Distâncias Qui-Quadrado

ABCDETotal
Geologia0,0292,0801,0500,0045,8739,036
Bioquímica0,0151,5210,2582,9133,1767,882
Química0,1730,8020,0520,0000,3441,373
Zoologia0,5990,9570,70312,4380,49615,194
Física6,9640,7340,1534,8590,19612,906
Engenharia0,0530,7022,5080,0386,70010,001
Microbiologia0,1350,0000,0120,1660,3510,663
Botânica3,3490,2420,0080,6730,1214,393
Estatística0,6710,0240,0080,1040,0060,814
Matemática0,3540,1901,4441,7040,0183,710
Total12,3437,2526,19622,89917,28265,972

Nessa tabela, a célula para Zoologia e categoria de financiamento D é 12.438, o que responde pela maior contribuição para o qui-quadrado total (65,972). Das categorias de linha, Zoologia (15,194), Física (12,906) e Engenharia (10,001) contribuem mais para o qui-quadrado total. Das categorias de coluna, os níveis de financiamento D (22,899) e E (17,282) contribuem mais para o qui-quadrado total.

Inércias relativas

A inércia da célula é o valor qui-quadrado na célula dividido pela frequência total da tabela de contingência. A soma de todas as inércias da célula é a inércia total ou simplesmente a inércia. A inércia relativa de uma célula é inércia da célula divida pela inércia total. A inércia relativa de uma linha é a soma das inércias da célula para a linha dividida pela inércia total. A inércia relativa de uma coluna é a soma das inércias da célula para a coluna dividida pela inércia total.

Interpretação

Use a inércia relativa para avaliar a força das associações entre categorias e contribuições para a variação nos dados. Valores mais altos geralmente indicam uma associação mais forte e maior proporção da variabilidade total dos valores esperados nos dados.

Inércias Relativas

ABCDETotal
Geologia0,0000,0320,0160,0000,0890,137
Bioquímica0,0000,0230,0040,0440,0480,119
Química0,0030,0120,0010,0000,0050,021
Zoologia0,0090,0150,0110,1890,0080,230
Física0,1060,0110,0020,0740,0030,196
Engenharia0,0010,0110,0380,0010,1020,152
Microbiologia0,0020,0000,0000,0030,0050,010
Botânica0,0510,0040,0000,0100,0020,067
Estatística0,0100,0000,0000,0020,0000,012
Matemática0,0050,0030,0220,0260,0000,056
Total0,1870,1100,0940,3470,2621,000

A tabela Inércias relativas mostra a contribuição relativa de cada célula à estatística qui-quadrado total. Quanto maior a inércia relativa em uma célula, maior a associação entre as categorias de linha e coluna. Nessa tabela, a célula para Zoologia e categoria de financiamento D tem a maior inércia relativa (0,189), que é a associação mais forte da tabela. A tabela também indica a inércia relativa total de cada linha e coluna.