Considerações de dados para Tabulação cruzada e qui-quadrado

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes ao coletar dados, realizar a análise, e interpretar os resultados.

Os dados da amostra devem ser selecionados aleatoriamente

As amostras aleatórias são usadas para fazer generalizações, ou inferências, sobre uma população. Se seus dados não foram coletados aleatoriamente, seus resultados podem não ser válidos.

Cada observação deve ser independente de todas as outras observações

A independência das observações é um pressuposto fundamental para o teste do qui-quadrado de associação.

Todos os dados devem ser classificados em categorias de linhas e colunas mutuamente exclusivas

O teste de associação para o qui-quadrado não pode ser realizado quando as categorias das variáveis se sobrepõem. Assim, cada observação deve ser categorizada em uma e apenas uma categoria.

As contagens esperadas não devem ser pequenas demais
Cada amostra deve ser grande o suficiente para que haja uma probabilidade razoável de observação dos resultados em cada categoria. Se as contagens esperadas forem muito baixas, o valor-p para o teste pode não ser preciso. O Minitab indica, em seus resultados, se as contagens esperadas são baixas demais.
Se a contagem esperada para uma categoria for muito baixa, é possível combinar essa categoria com as categorias adjacentes para alcançar a contagem mínima esperada. Você deve combinar categorias somente quando necessário porque as informações são perdidas quando as categorias são combinadas. Ou é possível usar o teste exato de Fisher, que é preciso para todos os tamanhos amostrais. Para obter mais informações, vá para O que é o teste exato de Fisher?.