A tabela de contingência calcula observações de acordo com múltiplas variáveis categóricas. As linhas e colunas da tabela correspondem a essas variáveis categóricas. A tabela também inclui totais marginais para cada nível das variáveis.
A tabela de contingência para análise de correspondência simples é uma tabela de dois fatores que calcula observações para duas variáveis. Você também pode categorizar observações para três ou quatro variáveis usando a subcaixa de diálogo Combinar para cruzar as variáveis e criar as linhas e/ou colunas de uma tabela de dois fatores.
Use a tabela de contingência para exibir a frequência observadas para cada célula definida por uma categoria de linha e uma categoria de coluna. Use a coluna e totais de linha para ver a frequência total de cada categoria.
A | B | C | D | E | Total | |
---|---|---|---|---|---|---|
Geologia | 3,000 | 19,000 | 39,000 | 14,000 | 10,000 | 85,000 |
Bioquímica | 1,000 | 2,000 | 13,000 | 1,000 | 12,000 | 29,000 |
Química | 6,000 | 25,000 | 49,000 | 21,000 | 29,000 | 130,000 |
Zoologia | 3,000 | 15,000 | 41,000 | 35,000 | 26,000 | 120,000 |
Física | 10,000 | 22,000 | 47,000 | 9,000 | 26,000 | 114,000 |
Engenharia | 3,000 | 11,000 | 25,000 | 15,000 | 34,000 | 88,000 |
Microbiologia | 1,000 | 6,000 | 14,000 | 5,000 | 11,000 | 37,000 |
Botânica | 0,000 | 12,000 | 34,000 | 17,000 | 23,000 | 86,000 |
Estatística | 2,000 | 5,000 | 11,000 | 4,000 | 7,000 | 29,000 |
Matemática | 2,000 | 11,000 | 37,000 | 8,000 | 20,000 | 78,000 |
Total | 31,000 | 128,000 | 310,000 | 129,000 | 198,000 | 796,000 |
A tabela de contingência de dois fatores a seguir mostra as contagens observadas de pesquisadores em cada disciplina acadêmica e na categoria financiamento (A, B, C, D, E). A coluna Total indica que a maioria dos pesquisadores estão nos campos da Química (130), Zoologia (120) e Física (114). A linha Total indica que a maioria dos pesquisadores estão classificados sob a categoria de financiamento C (310). Para as contagens de células, os pesquisadores em Química, que são classificados na categoria de financiamento C, têm a mais alta frequência observada (49).
A frequência esperada é a contagem das observações que se esperaria em uma célula, em média, se as variáveis fossem independentes. O Minitab calcula as contagens esperadas como o produto dos totais de linhas e colunas dividido pelo número total de observações.
A | B | C | D | E | |
---|---|---|---|---|---|
Geologia | 3,310 | 13,668 | 33,103 | 13,775 | 21,143 |
Bioquímica | 1,129 | 4,663 | 11,294 | 4,700 | 7,214 |
Química | 5,063 | 20,905 | 50,628 | 21,068 | 32,337 |
Zoologia | 4,673 | 19,296 | 46,734 | 19,447 | 29,849 |
Física | 4,440 | 18,332 | 44,397 | 18,475 | 28,357 |
Engenharia | 3,427 | 14,151 | 34,271 | 14,261 | 21,889 |
Microbiologia | 1,441 | 5,950 | 14,410 | 5,996 | 9,204 |
Botânica | 3,349 | 13,829 | 33,492 | 13,937 | 21,392 |
Estatística | 1,129 | 4,663 | 11,294 | 4,700 | 7,214 |
Matemática | 3,038 | 12,543 | 30,377 | 12,641 | 19,402 |
A tabela de frequência esperada a seguir mostra as contagens esperadas de pesquisadores em cada disciplina acadêmica e categoria de financiamento (A, B, C, D, E), supondo-se que a relação entre financiamento e disciplina acadêmica é independente. Como a maioria dos pesquisadores está em Química e a maioria dos departamentos está no financiamento da categoria C, a combinação dessas categorias tem o mais alto valor esperado (aproximadamente 51).
O observado − frequências esperadas é a diferença entre a contagem das observações reais na célula e a contagem das observações na célula que você espera, se as variáveis forem independentes.
Use a diferença entre as frequências observadas e esperadas para procurar evidências das possíveis associações nos dados. Se houver duas variáveis associadas, a distribuição de observações de uma variável irá diferir de acordo com a categoria da segunda variável. Como resultado, a magnitude da diferença entre a frequência observada e a frequência esperada é relativamente grande. Se as duas variáveis forem independentes, a distribuição das observações de uma variável é semelhante para todas as categorias da segunda variável. Como resultado, a magnitude da diferença entre a frequência observada e a frequência esperada é relativamente pequena.
A | B | C | D | E | |
---|---|---|---|---|---|
Geologia | -0,310 | 5,332 | 5,897 | 0,225 | -11,143 |
Bioquímica | -0,129 | -2,663 | 1,706 | -3,700 | 4,786 |
Química | 0,937 | 4,095 | -1,628 | -0,068 | -3,337 |
Zoologia | -1,673 | -4,296 | -5,734 | 15,553 | -3,849 |
Física | 5,560 | 3,668 | 2,603 | -9,475 | -2,357 |
Engenharia | -0,427 | -3,151 | -9,271 | 0,739 | 12,111 |
Microbiologia | -0,441 | 0,050 | -0,410 | -0,996 | 1,796 |
Botânica | -3,349 | -1,829 | 0,508 | 3,063 | 1,608 |
Estatística | 0,871 | 0,337 | -0,294 | -0,700 | -0,214 |
Matemática | -1,038 | -1,543 | 6,623 | -4,641 | 0,598 |
Nessa tabela, a magnitude da diferença entre a contagem observada e a contagem esperada é relativamente grande para Zoologia e a categoria de financiamento D (15,553) e para Engenharia e para a categoria de financiamento E (12,111). Para essas células, as contagens observadas são maiores do que a contagem que você esperaria se as variáveis forem independentes. A magnitude da diferença também é relativamente grande para Geologia e para a categoria de financiamento E (-11,143). Para esta célula, a contagem observada é menor do que a contagem que você esperaria se as variáveis fossem independentes. Portanto, você pode concluir que consideravelmente mais departamentos de engenharia não foram financiados do que o esperado, e consideravelmente menos departamentos de geologia não foram financiados do que o esperado.
O Minitab exibe a contribuição de cada célula para a estatística qui-quadrado, como a distância qui-quadrado. A distância qui-quadrado de cada célula estabelece o quanto da estatística total de qui-quadrado é atribuível à divergência de cada célula.
O Minitab calcula a contribuição de cada célula para a estatística qui-quadrado como o quadrado da diferença entre os valores observados e esperados para uma célula, dividido pelo valor esperado para essa célula. O qui-quadrado total é a soma dos valores para todas as células.
Você pode comparar as distâncias qui-quadrado de cada célula para avaliar quais células contribuem mais para o qui-quadrado total. Se as frequências das células observadas e esperadas diferir muito, o valor qui-quadrado da célula é maior. Portanto, uma distância qui-quadrado maior em uma célula sugere uma associação mais forte entre as categorias de linha e de coluna do que é esperado por chance.
A | B | C | D | E | Total | |
---|---|---|---|---|---|---|
Geologia | 0,029 | 2,080 | 1,050 | 0,004 | 5,873 | 9,036 |
Bioquímica | 0,015 | 1,521 | 0,258 | 2,913 | 3,176 | 7,882 |
Química | 0,173 | 0,802 | 0,052 | 0,000 | 0,344 | 1,373 |
Zoologia | 0,599 | 0,957 | 0,703 | 12,438 | 0,496 | 15,194 |
Física | 6,964 | 0,734 | 0,153 | 4,859 | 0,196 | 12,906 |
Engenharia | 0,053 | 0,702 | 2,508 | 0,038 | 6,700 | 10,001 |
Microbiologia | 0,135 | 0,000 | 0,012 | 0,166 | 0,351 | 0,663 |
Botânica | 3,349 | 0,242 | 0,008 | 0,673 | 0,121 | 4,393 |
Estatística | 0,671 | 0,024 | 0,008 | 0,104 | 0,006 | 0,814 |
Matemática | 0,354 | 0,190 | 1,444 | 1,704 | 0,018 | 3,710 |
Total | 12,343 | 7,252 | 6,196 | 22,899 | 17,282 | 65,972 |
Nessa tabela, a célula para Zoologia e categoria de financiamento D é 12.438, o que responde pela maior contribuição para o qui-quadrado total (65,972). Das categorias de linha, Zoologia (15,194), Física (12,906) e Engenharia (10,001) contribuem mais para o qui-quadrado total. Das categorias de coluna, os níveis de financiamento D (22,899) e E (17,282) contribuem mais para o qui-quadrado total.
A inércia da célula é o valor qui-quadrado na célula dividido pela frequência total da tabela de contingência. A soma de todas as inércias da célula é a inércia total ou simplesmente a inércia. A inércia relativa de uma célula é inércia da célula divida pela inércia total. A inércia relativa de uma linha é a soma das inércias da célula para a linha dividida pela inércia total. A inércia relativa de uma coluna é a soma das inércias da célula para a coluna dividida pela inércia total.
Use a inércia relativa para avaliar a força das associações entre categorias e contribuições para a variação nos dados. Valores mais altos geralmente indicam uma associação mais forte e maior proporção da variabilidade total dos valores esperados nos dados.
A | B | C | D | E | Total | |
---|---|---|---|---|---|---|
Geologia | 0,000 | 0,032 | 0,016 | 0,000 | 0,089 | 0,137 |
Bioquímica | 0,000 | 0,023 | 0,004 | 0,044 | 0,048 | 0,119 |
Química | 0,003 | 0,012 | 0,001 | 0,000 | 0,005 | 0,021 |
Zoologia | 0,009 | 0,015 | 0,011 | 0,189 | 0,008 | 0,230 |
Física | 0,106 | 0,011 | 0,002 | 0,074 | 0,003 | 0,196 |
Engenharia | 0,001 | 0,011 | 0,038 | 0,001 | 0,102 | 0,152 |
Microbiologia | 0,002 | 0,000 | 0,000 | 0,003 | 0,005 | 0,010 |
Botânica | 0,051 | 0,004 | 0,000 | 0,010 | 0,002 | 0,067 |
Estatística | 0,010 | 0,000 | 0,000 | 0,002 | 0,000 | 0,012 |
Matemática | 0,005 | 0,003 | 0,022 | 0,026 | 0,000 | 0,056 |
Total | 0,187 | 0,110 | 0,094 | 0,347 | 0,262 | 1,000 |
A tabela Inércias relativas mostra a contribuição relativa de cada célula à estatística qui-quadrado total. Quanto maior a inércia relativa em uma célula, maior a associação entre as categorias de linha e coluna. Nessa tabela, a célula para Zoologia e categoria de financiamento D tem a maior inércia relativa (0,189), que é a associação mais forte da tabela. A tabela também indica a inércia relativa total de cada linha e coluna.