Medições de associação para Tabulação cruzada e qui-quadrado

Encontre definições e orientações de interpretação para cada estatística fornecida com as medidas de associação.

Teste exato de Fisher, valor-p

O teste exato de Fisher é um teste de independência. O teste exato de Fisher é útil quando as contagens de células esperadas são baixas e a aproximação do qui-quadrado não é muito boa.

O valor-p é uma probabilidade que mede a evidência contra a hipótese nula. As probabilidades inferiores fornecem evidências mais fortes contra a hipótese nula.

Use o valor-p para determinar se deve ou não rejeitar a hipótese nula, o que indica que as variáveis são independentes.

Interpretação

Para determinar se as variáveis são independentes, compare o valor-p com o nível de significância. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de concluir que existe uma associação entre as variáveis quando não existe uma associação real.
Valor-p ≤ α: as variáveis apresentam uma associação estatisticamente significativa (rejeite H0)
Se o valor-p for menor ou igual ao nível de significância, rejeite a hipótese nula e conclua que há uma associação estatisticamente significativa entre as variáveis.
Valor-p > α: não é possível concluir que as variáveis estão associadas (não deve rejeitar H0)
Se o valor-p for maior do que o nível de significância, você não deve rejeitar a hipótese nula porque não há evidências suficientes para concluir que as variáveis estão associadas.

Para obter mais informações, vá para O que é o teste exato de Fisher?.

Teste de McNemar

Use o teste de McNemar para determinar se as proporções pareadas são diferentes.

Interpretação

Diferença estimada
O Minitab calcula a diferença entre as proporções marginais.
IC de 95%
O Minitab calcula o intervalo de confiança de 95% para a diferença entre as probabilidades marginais.
Os intervalos de confiança de 95% (IC 95%) são os intervalos de valores que tendem a conter o verdadeiro valor da diferença entre as probabilidades marginais.
P
O Minitab calcula o valor-p para testar a hipótese nula.
Para determinar se as probabilidades marginais são significativamente diferentes, compare o valor-p ao seu nível de significância (denotado como α ou alfa) para avaliar a hipótese nula. A hipótese nula afirma que as probabilidades marginais são iguais. Geralmente, um nível de significância de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de concluir que existe uma diferença quando isso não acontece.
Valor-p ≤ α: as probabilidades marginais são estatisticamente diferentes
Se o valor-p é menor ou igual ao nível de significância, você deve rejeitar a hipótese nula e concluir que as probabilidades marginais são significativamente diferentes. Por exemplo, a probabilidade anterior é diferente da probabilidade posterior.
Valor-p > α: as probabilidades marginais não são significativamente diferentes
Se o valor-p for maior do que o nível de significância, você não deve rejeitar a hipótese nula, porque não há evidências suficientes para concluir que as probabilidades marginais são diferentes. Por exemplo, não é possível concluir que as probabilidades anteriores e posteriores sejam diferentes.

Para obter mais informações, vá para Por que usar o teste de McNemar?.

O teste Mantel-Haenszel-Cochran?

Utilize o teste MHC para testar as associações condicionais de duas variáveis binárias na presença de uma terceira variável categórica.

O Minitab calcula uma relação entre comuns e raros através das tabelas e um valor-p para avaliar a sua significância.

Interpretação

Relação entre comuns e raros
O Minitab calcula uma relação entre comuns e raros, o que indica a força da associação.
Estatística de MHC
A estatística de MHC é utilizado para indicar se a associação é estatisticamente significativa.
DF
A estatística de MHC é comparada com um percentil de qui-quadrado com um grau de liberdade.
Valor-p
O Minitab calcula o valor-p para testar a hipótese nula.
Use o valor-p para determinar se deve ou não rejeitar a hipótese nula, o que indica que as duas variáveis binárias são independentes, condicionadas à terceira variável.

Para obter mais informações, vá para O que é o teste Cochran-Mantel-Haenszel?.

V-quadrado de Cramer

O V2 de Cramer mede a associação entre duas variáveis (a variável de linha e a variável de coluna). Os valores do V2 de variam entre 0 e 1. Os valores altos do V2 de Cramer indicam uma relação mais forte entre as variáveis, e os valores menores para o V2 indicam uma relação fraca. Um valor de 0 indica que não existe uma associação. Um valor de 1 indica que não há uma associação muito forte entre as variáveis.

Kappa

O kappa mede o grau de concordância das avaliações nominais ou ordinais feitas por diversos avaliadores ao avaliar as mesmas amostras. Quando você tem classificações ordinais, como as classificações de gravidade de defeitos em uma escala de 1-5, as medidas de concordância das categorias ordinais, que levam a ordenação em consideração, geralmente são as estatísticas mais apropriadas para determinar associação que somente kappa.

Interpretação

Os valores de Kappa variam de -1 até +1. Quanto maior o valor de kappa, mais forte a concordância.

Quando:
  • Kappa = 1, a concordância perfeita existe.
  • Kappa = 0, a concordância é aquela que seria esperada ao acaso.
  • Kappa < 0, a concordância é mais fraca que o esperado pelo acaso; isto ocorre raramente.

Lambda e tau de Goodman-Kruskal

Lambda (λ) e tau (τ) de Goodman-Kruskal medem a força de associação com base na capacidade de adivinhar ou prever corretamente o valor de uma variável quando você conhece o valor da outra. Lambda é baseado em probabilidades modais, enquanto tau é baseado na atribuição aleatória de categoria.

Interpretação

Lambda (λ)
Lambda mede a melhoria percentual da probabilidade da variável dependente (variável de linha ou coluna) dado o valor de outras variáveis (variáveis de linha ou coluna).
Os valores de lambda variam entre 0 e 1. Um valor de 0 significa que a variável independente não melhora a previsão das categorias da variável dependente. Um valor de 1 significa que a variável independente prediz totalmente as categorias da variável dependente. Um valor de 0,5 significa que o erro de predição é reduzido em 50%.
Tau (τ)
Tau mede a melhoria percentual de previsibilidade da variável dependente (variável de linha ou coluna) dado o valor de outras variáveis (variáveis de linha ou coluna). O tau de Goodman-Kruskal é o mesmo que lambda de Goodman-Kruskal exceto que os cálculos da estatística tau são baseados em probabilidades de atribuição especificadas por proporções marginais ou condicionais.
Os valores de tau variam de -1 (associação negativa perfeita) a +1 (associação positiva perfeita). Um valor 0 indica a ausência de associação.

Para obter mais informações, vá para O que são as estatísticas de Goodman-Kruskal?.

Medidas de concordância para categorias ordinais

Número de pares concordantes e discordantes
Utilize pares concordantes e discordantes para descrever a relação entre pares de observações. Para calcular os pares concordantes e discordantes, os dados são tratados como ordinais, de forma que os dados ordinais devem ser adequados à sua aplicação. Os números de pares concordantes e discordantes são usados em cálculos para o tau de Kendall, que mede a associação entre duas variáveis ordinais.
Para obter mais informações, vá para O que são pares concordantes e discordantes?.
Gama de Goodman-Kruskal (γ)
O gama de Goodman-Kruskal (γ) mostra quantos pares existem a mais que são concordantes do que discordantes, divididos pelo número total de pares. Use o gama de Goodman-Kruskal para medir a associação entre as variáveis ordinais.
Uma associação perfeita existe quando |γ| = 1. Em regressão logística ordinal e binária, se X e Y forem independentes, γ = 0.
Para obter mais informações, vá para O que são as estatísticas de Goodman-Kruskal?.
D de Somers
O D de Somers mede a força e a direção da relação entre pares de variáveis. Os valores do D de Somers variam de -1 (todos os pares discordam) até 1 (todos os pares concordam).
O Minitab exibe dois valores para D, um valor para quando a variável de linha é a variável dependente, e um valor para quando a variável de coluna é a variável dependente. Você deve determinar qual caso é apropriado para a sua análise.
Tau-b de Kendall
O tau b de Kendall é usado em tabulação cruzada para medir a associação entre duas variáveis ordinais.
Os valores de tau-b de Kendall variam de -1,0 a 1,0. Um valor positivo indica que ambas as variáveis aumentam em conjunto. Um valor negativo indica que ambas as variáveis diminuem em conjunto.

R de Pearson e rô de Spearman

Use o r de Pearson e o rô de Spearman para avaliar a associação entre duas variáveis que possuam categorias ordinais. Categorias ordinais possuem um a ordem natural, como pequeno, médio e grande.

O coeficiente pode variar de -1 a +1. Quanto maior for o valor absoluto do coeficiente, mais forte é a relação entre as variáveis. Um valor absoluto de 1 indica uma relação perfeita, e um valor zero indica ausência de relação ordinal. A interpretação de um valor intermediário como correlação fraca, média ou forte depende das metas e requisitos.

Para obter mais informações, vá para O que é rô de Spearman e r de Pearson para categorias ordinais?.