Frequências e distâncias qui-quadrado para Análise de correspondência simples

Encontre definições e interpretação para cada estatística que é fornecida para frequências e distâncias qui-quadrado para análise de correspondência simples.

Tabela de contingência

A tabela de contingência calcula observações de acordo com múltiplas variáveis categóricas. As linhas e colunas da tabela correspondem a essas variáveis categóricas. A tabela também inclui totais marginais para cada nível das variáveis.

A tabela de contingência para análise de correspondência simples é uma tabela de dois fatores que calcula observações para duas variáveis. Você também pode categorizar observações para três ou quatro variáveis usando a subcaixa de diálogo Combinar para cruzar as variáveis e criar as linhas e/ou colunas de uma tabela de dois fatores.

Interpretação

Use a tabela de contingência para exibir a frequência observadas para cada célula definida por uma categoria de linha e uma categoria de coluna. Use a coluna e totais de linha para ver a frequência total de cada categoria.

Tabela de Contingência A B C D E Total Geologia 3,000 19,000 39,000 14,000 10,000 85,000 Bioquímica 1,000 2,000 13,000 1,000 12,000 29,000 Química 6,000 25,000 49,000 21,000 29,000 130,000 Zoologia 3,000 15,000 41,000 35,000 26,000 120,000 Física 10,000 22,000 47,000 9,000 26,000 114,000 Engenharia 3,000 11,000 25,000 15,000 34,000 88,000 Microbiologia 1,000 6,000 14,000 5,000 11,000 37,000 Botânica 0,000 12,000 34,000 17,000 23,000 86,000 Estatística 2,000 5,000 11,000 4,000 7,000 29,000 Matemática 2,000 11,000 37,000 8,000 20,000 78,000 Total 31,000 128,000 310,000 129,000 198,000 796,000

A tabela de contingência de dois fatores a seguir mostra as contagens observadas de pesquisadores em cada disciplina acadêmica e na categoria financiamento (A, B, C, D, E). A coluna Total indica que a maioria dos pesquisadores estão nos campos da Química (130), Zoologia (120) e Física (114). A linha Total indica que a maioria dos pesquisadores estão classificados sob a categoria de financiamento C (310). Para as contagens de células, os pesquisadores em Química, que são classificados na categoria de financiamento C, têm a mais alta frequência observada (49).

Frequências esperadas

A frequência esperada é a contagem das observações que se esperaria em uma célula, em média, se as variáveis fossem independentes. O Minitab calcula as contagens esperadas como o produto dos totais de linhas e colunas dividido pelo número total de observações.

Frequências Esperadas A B C D E Geologia 3,310 13,668 33,103 13,775 21,143 Bioquímica 1,129 4,663 11,294 4,700 7,214 Química 5,063 20,905 50,628 21,068 32,337 Zoologia 4,673 19,296 46,734 19,447 29,849 Física 4,440 18,332 44,397 18,475 28,357 Engenharia 3,427 14,151 34,271 14,261 21,889 Microbiologia 1,441 5,950 14,410 5,996 9,204 Botânica 3,349 13,829 33,492 13,937 21,392 Estatística 1,129 4,663 11,294 4,700 7,214 Matemática 3,038 12,543 30,377 12,641 19,402

A tabela de frequência esperada a seguir mostra as contagens esperadas de pesquisadores em cada disciplina acadêmica e categoria de financiamento (A, B, C, D, E), supondo-se que a relação entre financiamento e disciplina acadêmica é independente. Como a maioria dos pesquisadores está em Química e a maioria dos departamentos está no financiamento da categoria C, a combinação dessas categorias tem o mais alto valor esperado (aproximadamente 51).

Observado – Frequências esperadas

O observado − frequências esperadas é a diferença entre a contagem das observações reais na célula e a contagem das observações na célula que você espera, se as variáveis forem independentes.

Interpretação

Use a diferença entre as frequências observadas e esperadas para procurar evidências das possíveis associações nos dados. Se houver duas variáveis associadas, a distribuição de observações de uma variável irá diferir de acordo com a categoria da segunda variável. Como resultado, a magnitude da diferença entre a frequência observada e a frequência esperada é relativamente grande. Se as duas variáveis forem independentes, a distribuição das observações de uma variável é semelhante para todas as categorias da segunda variável. Como resultado, a magnitude da diferença entre a frequência observada e a frequência esperada é relativamente pequena.

Frequências Observadas - Esperadas A B C D E Geologia -0,310 5,332 5,897 0,225 -11,143 Bioquímica -0,129 -2,663 1,706 -3,700 4,786 Química 0,937 4,095 -1,628 -0,068 -3,337 Zoologia -1,673 -4,296 -5,734 15,553 -3,849 Física 5,560 3,668 2,603 -9,475 -2,357 Engenharia -0,427 -3,151 -9,271 0,739 12,111 Microbiologia -0,441 0,050 -0,410 -0,996 1,796 Botânica -3,349 -1,829 0,508 3,063 1,608 Estatística 0,871 0,337 -0,294 -0,700 -0,214 Matemática -1,038 -1,543 6,623 -4,641 0,598

Nessa tabela, a magnitude da diferença entre a contagem observada e a contagem esperada é relativamente grande para Zoologia e a categoria de financiamento D (15,553) e para Engenharia e para a categoria de financiamento E (12,111). Para essas células, as contagens observadas são maiores do que a contagem que você esperaria se as variáveis forem independentes. A magnitude da diferença também é relativamente grande para Geologia e para a categoria de financiamento E (-11,143). Para esta célula, a contagem observada é menor do que a contagem que você esperaria se as variáveis fossem independentes. Portanto, você pode concluir que consideravelmente mais departamentos de engenharia não foram financiados do que o esperado, e consideravelmente menos departamentos de geologia não foram financiados do que o esperado.

Distâncias qui-quadrado

O Minitab exibe a contribuição de cada célula para a estatística qui-quadrado, como a distância qui-quadrado. A distância qui-quadrado de cada célula estabelece o quanto da estatística total de qui-quadrado é atribuível à divergência de cada célula.

O Minitab calcula a contribuição de cada célula para a estatística qui-quadrado como o quadrado da diferença entre os valores observados e esperados para uma célula, dividido pelo valor esperado para essa célula. O qui-quadrado total é a soma dos valores para todas as células.

Interpretação

Você pode comparar as distâncias qui-quadrado de cada célula para avaliar quais células contribuem mais para o qui-quadrado total. Se as frequências das células observadas e esperadas diferir muito, o valor qui-quadrado da célula é maior. Portanto, uma distância qui-quadrado maior em uma célula sugere uma associação mais forte entre as categorias de linha e de coluna do que é esperado por chance.

Distâncias Qui-Quadrado A B C D E Total Geologia 0,029 2,080 1,050 0,004 5,873 9,036 Bioquímica 0,015 1,521 0,258 2,913 3,176 7,882 Química 0,173 0,802 0,052 0,000 0,344 1,373 Zoologia 0,599 0,957 0,703 12,438 0,496 15,194 Física 6,964 0,734 0,153 4,859 0,196 12,906 Engenharia 0,053 0,702 2,508 0,038 6,700 10,001 Microbiologia 0,135 0,000 0,012 0,166 0,351 0,663 Botânica 3,349 0,242 0,008 0,673 0,121 4,393 Estatística 0,671 0,024 0,008 0,104 0,006 0,814 Matemática 0,354 0,190 1,444 1,704 0,018 3,710 Total 12,343 7,252 6,196 22,899 17,282 65,972

Nessa tabela, a célula para Zoologia e categoria de financiamento D é 12.438, o que responde pela maior contribuição para o qui-quadrado total (65,972). Das categorias de linha, Zoologia (15,194), Física (12,906) e Engenharia (10,001) contribuem mais para o qui-quadrado total. Das categorias de coluna, os níveis de financiamento D (22,899) e E (17,282) contribuem mais para o qui-quadrado total.

Inércias relativas

A inércia da célula é o valor qui-quadrado na célula dividido pela frequência total da tabela de contingência. A soma de todas as inércias da célula é a inércia total ou simplesmente a inércia. A inércia relativa de uma célula é inércia da célula divida pela inércia total. A inércia relativa de uma linha é a soma das inércias da célula para a linha dividida pela inércia total. A inércia relativa de uma coluna é a soma das inércias da célula para a coluna dividida pela inércia total.

Interpretação

Use a inércia relativa para avaliar a força das associações entre categorias e contribuições para a variação nos dados. Valores mais altos geralmente indicam uma associação mais forte e maior proporção da variabilidade total dos valores esperados nos dados.

Inércias Relativas A B C D E Total Geologia 0,000 0,032 0,016 0,000 0,089 0,137 Bioquímica 0,000 0,023 0,004 0,044 0,048 0,119 Química 0,003 0,012 0,001 0,000 0,005 0,021 Zoologia 0,009 0,015 0,011 0,189 0,008 0,230 Física 0,106 0,011 0,002 0,074 0,003 0,196 Engenharia 0,001 0,011 0,038 0,001 0,102 0,152 Microbiologia 0,002 0,000 0,000 0,003 0,005 0,010 Botânica 0,051 0,004 0,000 0,010 0,002 0,067 Estatística 0,010 0,000 0,000 0,002 0,000 0,012 Matemática 0,005 0,003 0,022 0,026 0,000 0,056 Total 0,187 0,110 0,094 0,347 0,262 1,000

A tabela Inércias relativas mostra a contribuição relativa de cada célula à estatística qui-quadrado total. Quanto maior a inércia relativa em uma célula, maior a associação entre as categorias de linha e coluna. Nessa tabela, a célula para Zoologia e categoria de financiamento D tem a maior inércia relativa (0,189), que é a associação mais forte da tabela. A tabela também indica a inércia relativa total de cada linha e coluna.

Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política