Interpretar todas as estatísticas para Teste qui-quadrado por associação

Encontre definições e orientações de interpretação para cada estatística fornecida com o teste qui-quadrado de associação.

Contagens observadas e esperadas

A contagem observada é o número real de observações em uma amostra de que pertencem a uma categoria.

A contagem esperada é a frequência com que se esperaria em uma célula, em média, se as variáveis fossem independentes. O Minitab calcula as contagens esperadas como o produto dos totais de linhas e colunas dividido pelo número total de observações.

Interpretação

É possível comparar os valores observados e os valores esperados para cada célula na tabela de saída. Nestes resultados, a contagem de células observada é o primeiro número em cada célula, e a contagem esperada é o segundo número em cada célula.

Se houver duas variáveis associadas, a distribuição de observações de uma variável irá variar de acordo com a categoria da segunda variável. Se as duas variáveis forem independentes, a distribuição das observações de uma variável será semelhante a todas as categorias à segunda variável. Neste exemplo, na coluna 1, linha 2 da tabela, a contagem observada é 76, e a contagem esperada é de 60,78. A contagem observada parece ser muito maior do que seria esperado se as variáveis fossem independentes.

Estatísticas Tabuladas: ID da Máquina; Colunas da worksheet

Linhas: ID da Máquina Colunas: Colunas da worksheet 1º turno 2º turno 3º turno Todos 1 48 47 48 143 56,08 46,97 39,96 2 76 47 32 155 60,78 50,91 43,31 3 36 40 34 110 43,14 36,13 30,74 Todos 160 134 114 408 Conteúdo da Célula Contagem Contagem esperada

Todas as contagens de linha e coluna

O Minitab exibe as contagens marginais para linhas e colunas.
Contagens de linhas
A soma das contagens em cada uma das linhas da tabela.
Contagem de colunas
A soma das contagens abaixo de cada uma das colunas da tabela.
Total
A soma das contagens para todas as células. A soma de todas as contagens de linhas é igual à soma de todas as contagens de coluna.

Interpretação

Use as contagens marginais para entender como as contagens são distribuídas entre as categorias.

Nestes resultados, o total para a linha 1 é 143, o total da linha 2 é 155, e o total para a linha 3 é 110. A soma de todas as linhas é de 408. O total para a coluna 1 é de 160, o total para a coluna 2 é 134 e o total para a coluna 3 é 114. A soma de todas as colunas é 408.

Estatísticas Tabuladas: ID da Máquina; Colunas da worksheet

Linhas: ID da Máquina Colunas: Colunas da worksheet 1º turno 2º turno 3º turno Todos 1 48 47 48 143 56,08 46,97 39,96 2 76 47 32 155 60,78 50,91 43,31 3 36 40 34 110 43,14 36,13 30,74 Todos 160 134 114 408 Conteúdo da Célula Contagem Contagem esperada

Contribuição ao qui-quadrado

O Minitab exibe a contribuição de cada célula para a estatística qui-quadrado, o que estabelece o quanto da estatística total de qui-quadrado é atribuível à divergência de cada célula.

O Minitab calcula a contribuição de cada célula para a estatística qui-quadrado como o quadrado da diferença entre os valores observados e esperados para uma célula, dividido pelo valor esperado para essa célula. A estatística qui-quadrado é a soma destes valores para todas as células.

Interpretação

Nestes resultados, a soma do qui-quadrado de cada célula é a estatística de qui-quadrado de Pearson, que é 11,788. As maiores contribuições são da Máquina 2, no 1º e 3º turnos. As menores contribuições são do 2º turno, nas Máquinas 1 e 2.

Teste Qui-Quadrado para Associação: ID da Máquina; Colunas da worksheet

Linhas: ID da Máquina Colunas: Colunas da worksheet 1º turno 2º turno 3º turno Todos 1 48 47 48 143 56,08 46,97 39,96 1,1637 0,0000 1,6195 2 76 47 32 155 60,78 50,91 43,31 3,8088 0,2998 2,9530 3 36 40 34 110 43,14 36,13 30,74 1,1809 0,4151 0,3468 Todos 160 134 114 408 Conteúdo da Célula Contagem Contagem esperada Contribuição para Qui-Quadrado
Teste qui-quadrado Qui-Quadrado GL Valor-p Pearson 11,788 4 0,019 Razão de verossimilhança 11,816 4 0,019

Qui-quadrado de Pearson e qui-quadrado da razão de verossimilhança

O Minitab realiza um teste do qui-quadrado de Pearson e um teste do qui-quadrado da razão de verossimilhança. Cada teste de qui-quadrado pode ser usado para determinar se as variáveis estão associadas (dependentes) ou não.
Teste qui-quadrado de Pearson

A estatística qui-quadrado de Pearson (χ2) envolve a diferença ao quadrado entre o observado e as frequências esperadas.

Teste qui-quadrado da razão de verossimilhanças

A estatística do qui-quadrado da razão de verossimilhança (G2) é baseada na razão das frequências observadas para as esperadas.

Interpretação

Use a estatística do qui-quadrado para testar se as variáveis estão associadas.

Nestes resultados, ambas as estatísticas do qui-quadrado são muito semelhantes. Use os valores-p para avaliar a significância da estatística do qui-quadrado.
Teste qui-quadrado Qui-Quadrado GL Valor-p Pearson 11,788 4 0,019 Razão de verossimilhança 11,816 4 0,019

Quando as contagens esperadas são pequenas, os resultados podem ser enganadores. Para obter mais informações, consulte o Considerações de dados para Teste qui-quadrado por associação

DF

Os graus de liberdade (DF) são o número de informações independentes sobre uma estatística. Os graus de liberdade para uma tabela é (número de linhas - 1), multiplicada por (número de colunas - 1).

Interpretação

O Minitab usa os graus de liberdade para determinar o valor-p associado à estatística de teste.

Nestes resultados, os graus de liberdade (DF) são quatro.
Teste qui-quadrado Qui-Quadrado GL Valor-p Pearson 11,788 4 0,019 Razão de verossimilhança 11,816 4 0,019

Valor-p

O valor-p é uma probabilidade que mede a evidência contra a hipótese nula. As probabilidades inferiores fornecem evidências mais fortes contra a hipótese nula.

Use o valor-p para determinar se deve ou não rejeitar a hipótese nula, o que indica que não existe nenhuma associação entre duas variáveis categóricas.

O Minitab usa a estatística do qui-quadrado para determinar o valor-p.

Observação

O Minitab não exibe o valor-p quando alguma contagem esperada é menor que 1 porque os resultados podem ser inválidos.

Interpretação

Para determinar se as variáveis são independentes, compare o valor-p com o nível de significância. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de concluir que existe uma associação entre as variáveis quando não existe uma associação real.
Valor-p ≤ α: as variáveis apresentam uma associação estatisticamente significativa (rejeite H0)
Se o valor-p for menor ou igual ao nível de significância, rejeite a hipótese nula e conclua que há uma associação estatisticamente significativa entre as variáveis.
Valor-p > α: não é possível concluir que as variáveis estão associadas (não deve rejeitar H0)
Se o valor-p for maior do que o nível de significância, você não deve rejeitar a hipótese nula porque não há evidências suficientes para concluir que as variáveis estão associadas.
Nestes resultados, o valor-p = 0,019. Como o valor-p é menor que α, você deve rejeitar a hipótese nula. É possível concluir que as variáveis estão associadas.
Teste qui-quadrado Qui-Quadrado GL Valor-p Pearson 11,788 4 0,019 Razão de verossimilhança 11,816 4 0,019

Resíduos brutos

Os resíduos brutos são as diferenças entre as contagens observadas e as contagens esperadas.
Contagem observada
A contagem observada é o número real de observações em uma amostra de que pertencem a uma categoria.
Contagem esperada

A contagem esperada é a frequência com que se esperaria em uma célula, em média, se as variáveis fossem independentes. O Minitab calcula as contagens esperadas como o produto dos totais de linhas e colunas dividido pelo número total de observações.

Interpretação

É possível comparar os valores observados e os valores esperados na tabela de saída.

Nestes resultados, a contagem observada de células é o primeiro número em cada célula, a contagem esperada é o segundo número em cada célula e o resíduo bruto é o terceiro número em cada célula. A Máquina 2, 2º turno tem a maior resíduo bruto, o que significa que a maior diferença entre os defeitos esperados e reais é encontrada na Máquina 2 durante o 2º turno.
Linhas: ID da Máquina Colunas: Colunas da worksheet 1º turno 2º turno 3º turno Todos 1 48 47 48 143 56,08 46,97 39,96 -8,078 0,034 8,044 2 76 47 32 155 60,78 50,91 43,31 15,216 -3,907 -11,309 3 36 40 34 110 43,14 36,13 30,74 -7,137 3,873 3,265 Todos 160 134 114 408 Conteúdo da Célula Contagem Contagem esperada Resíduos
A melhor maneira de comparar as contagens observadas e as contagens esperadas é com os resíduos padronizados.

Resíduos padronizados

Os resíduos padronizados são os resíduos brutos (ou a diferença entre as contagens observadas e as contagens esperadas) divididos pela raiz quadrada das conatagens esperadas.

Interpretação

É possível comparar os resíduos padronizados na tabela de saída para saber qual categoria de variáveis apresenta maior diferença entre as contagens esperadas e as contagens reais em relação ao tamanho amostral e parece ser dependente. Por exemplo, é possível avaliar os resíduos padronizados na tabela de saída para ver a associação entre máquina e turno para a produção de defeitos.

Nestes resultados, a contagem observada de células é o primeiro número em cada célula, a contagem esperada é o segundo número em cada célula e o resíduo padronizado é o terceiro número em cada célula. Os resíduos padronizados positivos indicam que houve mais cabos defeituosos do que o esperado. Os resíduos padronizados negativos indicam que houve menos cabos defeituosos do que o esperado.
Rows: Machine ID Columns: Worksheet columns 1st shift 2nd shift 3rd shift All 1 48 47 48 143 56.08 46.97 39.96 -1.0788 0.0050 1.2726 2 76 47 32 155 60.78 50.91 43.31 1.9516 -0.5476 -1.7184 3 36 40 34 110 43.14 36.13 30.74 -1.0867 0.6443 0.5889 All 160 134 114 408 Cell Contents: Count Expected count Standardized residual

Resíduos ajustados

Os resíduos ajustados são os resíduos brutos (ou a diferença entre as contagens observadas e as contagens esperadas) divididos por uma estimativa do erro padrão. Use os resíduos ajustados para explicar a variação devida ao tamanho amostral.

Interpretação

É possível comparar os resíduos ajustados na tabela de saída para saber quais categorias apresentam maior diferença entre as contagens esperadas e as contagens reais em relação ao tamanho amostral. Por exemplo, é possível saber qual máquina ou ou turno apresenta a maior diferença entre o número esperado de defeituosos e o número real de defeituosos.

Nestes resultados, a contagem observada de células é o primeiro número em cada célula, a contagem esperada é o segundo número em cada célula e o resíduo ajustado é o terceiro número em cada célula. Os resíduos ajustados positivos indicam que houve mais cabos defeituosos do que o esperado, ajustados para o tamanho amostral. Os resíduos ajustados negativos indicam que houve menos cabos defeituosos do que o esperado, ajustados para o tamanho amostral.
Linhas: ID da Máquina Colunas: Colunas da worksheet 1º turno 2º turno 3º turno Todos 1 48 47 48 143 56,08 46,97 39,96 -1,7169 0,0076 1,8602 2 76 47 32 155 60,78 50,91 43,31 3,1788 -0,8485 -2,5707 3 36 40 34 110 43,14 36,13 30,74 -1,6309 0,9199 0,8117 Todos 160 134 114 408 Conteúdo da Célula Contagem Contagem esperada Resíduos ajustados
Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política