Interpretar todas as estatísticas para Teste qui-quadrado para associação

Encontre definições e orientações de interpretação para cada estatística fornecida com o teste qui-quadrado de associação.

Contagens observadas e esperadas

A contagem observada é o número real de observações em uma amostra de que pertencem a uma categoria.

A contagem esperada é a frequência com que se esperaria em uma célula, em média, se as variáveis fossem independentes. O Minitab calcula as contagens esperadas como o produto dos totais de linhas e colunas dividido pelo número total de observações.

Interpretação

É possível comparar os valores observados e os valores esperados para cada célula na tabela de saída. Nestes resultados, a contagem de células observada é o primeiro número em cada célula, e a contagem esperada é o segundo número em cada célula.

Se houver duas variáveis associadas, a distribuição de observações de uma variável irá variar de acordo com a categoria da segunda variável. Se as duas variáveis forem independentes, a distribuição das observações de uma variável será semelhante a todas as categorias à segunda variável. Neste exemplo, na coluna 1, linha 2 da tabela, a contagem observada é 76, e a contagem esperada é de 60,78. A contagem observada parece ser muito maior do que seria esperado se as variáveis fossem independentes.

Linhas: ID da Máquina   Colunas: Colunas da worksheet

1º turno2º turno3º turnoTodos
         
1484748143
  56,0846,9739,96 
  -1,07880,00501,2726 
         
2764732155
  60,7850,9143,31 
  1,9516-0,5476-1,7184 
         
3364034110
  43,1436,1330,74 
  -1,08670,64430,5889 
         
Todos160134114408
Conteúdo da Célula
      Contagem
      Contagem esperada
      Resíduos padronizados

Todas as contagens de linha e coluna

O Minitab exibe as contagens marginais para linhas e colunas.
Contagens de linhas
A soma das contagens em cada uma das linhas da tabela.
Contagem de colunas
A soma das contagens abaixo de cada uma das colunas da tabela.
Total
A soma das contagens para todas as células. A soma de todas as contagens de linhas é igual à soma de todas as contagens de coluna.

Interpretação

Use as contagens marginais para entender como as contagens são distribuídas entre as categorias.

Nestes resultados, o total para a linha 1 é 143, o total da linha 2 é 155, e o total para a linha 3 é 110. A soma de todas as linhas é de 408. O total para a coluna 1 é de 160, o total para a coluna 2 é 134 e o total para a coluna 3 é 114. A soma de todas as colunas é 408.

Linhas: ID da Máquina   Colunas: Colunas da worksheet

1º turno2º turno3º turnoTodos
         
1484748143
  56,0846,9739,96 
  -1,07880,00501,2726 
         
2764732155
  60,7850,9143,31 
  1,9516-0,5476-1,7184 
         
3364034110
  43,1436,1330,74 
  -1,08670,64430,5889 
         
Todos160134114408
Conteúdo da Célula
      Contagem
      Contagem esperada
      Resíduos padronizados

Contribuição ao qui-quadrado

O Minitab exibe a contribuição de cada célula para a estatística qui-quadrado, o que estabelece o quanto da estatística total de qui-quadrado é atribuível à divergência de cada célula.

O Minitab calcula a contribuição de cada célula para a estatística qui-quadrado como o quadrado da diferença entre os valores observados e esperados para uma célula, dividido pelo valor esperado para essa célula. A estatística qui-quadrado é a soma destes valores para todas as células.

Interpretação

Nestes resultados, a soma do qui-quadrado de cada célula é a estatística de qui-quadrado de Pearson, que é 11,788. As maiores contribuições são da Máquina 2, no 1º e 3º turnos. As menores contribuições são do 2º turno, nas Máquinas 1 e 2.

Linhas: ID da Máquina   Colunas: Colunas da worksheet

1º turno2º turno3º turnoTodos
         
1484748143
  56,0846,9739,96 
  1,16370,00001,6195 
         
2764732155
  60,7850,9143,31 
  3,80880,29982,9530 
         
3364034110
  43,1436,1330,74 
  1,18090,41510,3468 
         
Todos160134114408
Conteúdo da Célula
      Contagem
      Contagem esperada
      Contribuição para Qui-Quadrado

Teste qui-quadrado

Qui-QuadradoGLValor-p
Pearson11,78840,019
Razão de verossimilhança11,81640,019

Qui-quadrado de Pearson e qui-quadrado da razão de verossimilhança

O Minitab realiza um teste do qui-quadrado de Pearson e um teste do qui-quadrado da razão de verossimilhança. Cada teste de qui-quadrado pode ser usado para determinar se as variáveis estão associadas (dependentes) ou não.
Teste qui-quadrado de Pearson

A estatística qui-quadrado de Pearson (χ2) envolve a diferença ao quadrado entre o observado e as frequências esperadas.

Teste qui-quadrado da razão de verossimilhanças

A estatística do qui-quadrado da razão de verossimilhança (G2) é baseada na razão das frequências observadas para as esperadas.

Interpretação

Use a estatística do qui-quadrado para testar se as variáveis estão associadas.

Nestes resultados, ambas as estatísticas do qui-quadrado são muito semelhantes. Use os valores-p para avaliar a significância da estatística do qui-quadrado.

Teste qui-quadrado

Qui-QuadradoGLValor-p
Pearson11,78840,019
Razão de verossimilhança11,81640,019

Quando as contagens esperadas são pequenas, os resultados podem ser enganadores. Para obter mais informações, consulte o Considerações de dados para Teste qui-quadrado para associação

DF

Os graus de liberdade (DF) são o número de informações independentes sobre uma estatística. Os graus de liberdade para uma tabela é (número de linhas - 1), multiplicada por (número de colunas - 1).

Interpretação

O Minitab usa os graus de liberdade para determinar o valor-p associado à estatística de teste.

Nestes resultados, os graus de liberdade (DF) são quatro.

Teste qui-quadrado

Qui-QuadradoGLValor-p
Pearson11,78840,019
Razão de verossimilhança11,81640,019

Valor-p

O valor-p é uma probabilidade que mede a evidência contra a hipótese nula. As probabilidades inferiores fornecem evidências mais fortes contra a hipótese nula.

Use o valor-p para determinar se deve ou não rejeitar a hipótese nula, o que indica que não existe nenhuma associação entre duas variáveis categóricas.

O Minitab usa a estatística do qui-quadrado para determinar o valor-p.

Observação

O Minitab não exibe o valor-p quando alguma contagem esperada é menor que 1 porque os resultados podem ser inválidos.

Interpretação

Para determinar se as variáveis são independentes, compare o valor-p com o nível de significância. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de concluir que existe uma associação entre as variáveis quando não existe uma associação real.
Valor-p ≤ α: as variáveis apresentam uma associação estatisticamente significativa (rejeite H0)
Se o valor-p for menor ou igual ao nível de significância, rejeite a hipótese nula e conclua que há uma associação estatisticamente significativa entre as variáveis.
Valor-p > α: não é possível concluir que as variáveis estão associadas (não deve rejeitar H0)
Se o valor-p for maior do que o nível de significância, você não deve rejeitar a hipótese nula porque não há evidências suficientes para concluir que as variáveis estão associadas.

Nestes resultados, o valor-p = 0,019. Como o valor-p é menor que α, você deve rejeitar a hipótese nula. É possível concluir que as variáveis estão associadas.

Teste qui-quadrado

Qui-QuadradoGLValor-p
Pearson11,78840,019
Razão de verossimilhança11,81640,019

Resíduos brutos

Os resíduos brutos são as diferenças entre as contagens observadas e as contagens esperadas.
Contagem observada
A contagem observada é o número real de observações em uma amostra de que pertencem a uma categoria.
Contagem esperada

A contagem esperada é a frequência com que se esperaria em uma célula, em média, se as variáveis fossem independentes. O Minitab calcula as contagens esperadas como o produto dos totais de linhas e colunas dividido pelo número total de observações.

Interpretação

É possível comparar os valores observados e os valores esperados na tabela de saída.

Nestes resultados, a contagem observada de células é o primeiro número em cada célula, a contagem esperada é o segundo número em cada célula e o resíduo bruto é o terceiro número em cada célula. A Máquina 2, 1º turno tem a maior resíduo bruto, o que significa que a maior diferença entre os defeitos esperados e reais é encontrada na Máquina 2 durante o 2º turno.

Linhas: ID da Máquina   Colunas: Colunas da worksheet

1º turno2º turno3º turnoTodos
         
1484748143
  56,0846,9739,96 
  -8,0780,0348,044 
         
2764732155
  60,7850,9143,31 
  15,216-3,907-11,309 
         
3364034110
  43,1436,1330,74 
  -7,1373,8733,265 
         
Todos160134114408
Conteúdo da Célula
      Contagem
      Contagem esperada
      Resíduos
A melhor maneira de comparar as contagens observadas e as contagens esperadas é com os resíduos padronizados.

Resíduos padronizados

Os resíduos padronizados são os resíduos brutos (ou a diferença entre as contagens observadas e as contagens esperadas) divididos pela raiz quadrada das conatagens esperadas.

Interpretação

É possível comparar os resíduos padronizados na tabela de saída para saber qual categoria de variáveis apresenta maior diferença entre as contagens esperadas e as contagens reais em relação ao tamanho amostral e parece ser dependente. Por exemplo, é possível avaliar os resíduos padronizados na tabela de saída para ver a associação entre máquina e turno para a produção de defeitos.

Nestes resultados, a contagem observada de células é o primeiro número em cada célula, a contagem esperada é o segundo número em cada célula e o resíduo padronizado é o terceiro número em cada célula. Os resíduos padronizados positivos indicam que houve mais cabos defeituosos do que o esperado. Os resíduos padronizados negativos indicam que houve menos cabos defeituosos do que o esperado.

Linhas: ID da Máquina   Colunas: Colunas da worksheet

1º turno2º turno3º turnoTodos
         
1484748143
  56,0846,9739,96 
  -1,07880,00501,2726 
         
2764732155
  60,7850,9143,31 
  1,9516-0,5476-1,7184 
         
3364034110
  43,1436,1330,74 
  -1,08670,64430,5889 
         
Todos160134114408
Conteúdo da Célula
      Contagem
      Contagem esperada
      Resíduos padronizados

Resíduos ajustados

Os resíduos ajustados são os resíduos brutos (ou a diferença entre as contagens observadas e as contagens esperadas) divididos por uma estimativa do erro padrão. Use os resíduos ajustados para explicar a variação devida ao tamanho amostral.

Interpretação

É possível comparar os resíduos ajustados na tabela de saída para saber quais categorias apresentam maior diferença entre as contagens esperadas e as contagens reais em relação ao tamanho amostral. Por exemplo, é possível saber qual máquina ou ou turno apresenta a maior diferença entre o número esperado de defeituosos e o número real de defeituosos.

Nestes resultados, a contagem observada de células é o primeiro número em cada célula, a contagem esperada é o segundo número em cada célula e o resíduo ajustado é o terceiro número em cada célula. Os resíduos ajustados positivos indicam que houve mais cabos defeituosos do que o esperado, ajustados para o tamanho amostral. Os resíduos ajustados negativos indicam que houve menos cabos defeituosos do que o esperado, ajustados para o tamanho amostral.

Linhas: ID da Máquina   Colunas: Colunas da worksheet

1º turno2º turno3º turnoTodos
         
1484748143
  56,0846,9739,96 
  -1,71690,00761,8602 
         
2764732155
  60,7850,9143,31 
  3,1788-0,8485-2,5707 
         
3364034110
  43,1436,1330,74 
  -1,63090,91990,8117 
         
Todos160134114408
Conteúdo da Célula
      Contagem
      Contagem esperada
      Resíduos ajustados