Considerações de dados para Teste qui-quadrado para associação

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes ao coletar dados, realizar a análise, e interpretar os resultados.

Colete dados brutos ou dados de resumo
É possível utilizar duas colunas de dados brutos ou dados resumidos sob a forma de uma tabela de contingência. Se seus dados estiverem em forma de frequência, use Tabulação cruzada e qui-quadrado.
Observação

Não são permitidos valores faltantes em uma tabela de contingência.

Os dados da amostra devem ser selecionados aleatoriamente

Para cada nível de X, colete uma amostra aleatória de itens que sejam representativos do processo. Os níveis da variável X podem representar diferentes processos ou locais. Por exemplo, se você tiver várias filiais que processam faturas, você deve coletar uma amostra de faturas de cada filial.

As amostras aleatórias são usadas para fazer generalizações, ou inferências, sobre uma população. Se seus dados não foram coletados aleatoriamente, seus resultados podem não ser válidos.

Cada observação deve ser independente de todas as outras observações

A independência das observações é um pressuposto fundamental para o teste do qui-quadrado de associação.

Os dados devem ser categóricos
As variáveis categóricas contêm um número finito, contável de categorias ou grupos distintos. Os dados categóricos podem não ter uma ordem lógica. Por exemplo, os preditores categóricos incluem gênero, tipo de material e método de pagamento.
Todos os dados devem ser classificados em categorias mutuamente exclusivas, sem sobreposição

O teste de associação para o qui-quadrado não pode ser realizado quando as categorias das variáveis se sobrepõem. Assim, cada observação deve ser categorizada em uma e apenas uma categoria.

As contagens esperadas não devem ser pequenas demais
Cada amostra deve ser grande o suficiente para que haja uma probabilidade razoável de observação dos resultados em cada categoria. Se as contagens esperadas forem muito baixas, o valor-p para o teste pode não ser preciso. O Minitab indica se as contagens esperadas são baixas demais e o tamanho que cada amostra deve ter para garantir a validade do teste.
Se a contagem esperada para uma categoria for muito baixa, é possível combinar essa categoria com as categorias adjacentes para alcançar a contagem mínima esperada. Você deve combinar categorias somente quando necessário porque as informações são perdidas quando as categorias são combinadas.