Como os tamanhos amostrais são números inteiros, o poder real do teste pode ser um pouco maior do que o valor de poder que você especificar.
As definições e interpretações neste tópico se aplicam a um teste de equivalência padrão que utilizam a hipótese alternativa padrão (Limite inferior < média de teste - alvo < limite superior).
Poder para a diferença: | Média de teste - alvo |
---|---|
Hipótese nula: | Diferença ≤ -0,3 ou Diferença ≥ 0,3 |
Hipótese alternativa: | -0,3 < Diferença < 0,3 |
Nível α: | 0,05 |
Desvio padrão assumido: | 0,165 |
Diferença | Tamanho Amostral | Poder |
---|---|---|
0,2 | 25 | 0,902911 |
Estes resultados mostram que, se o tamanho amostral é 25 e a diferença é 0,2, o poder do teste de equivalência é de aproximadamente 0,9. Portanto, usar um tamanho amostral de 25 proporciona poder adequado para uma diferença de 0,2.
Use a curva de poder para avaliar o tamanho amostral ou o poder adequado para o seu teste.
A curva de poder representa todas as combinações de poder e diferença para cada tamanho amostral, quando o nível de significância e o desvio padrão são mantidos constantes. Cada símbolo na curva da poder representa um valor calculado com base nos valores inseridos. Por exemplo, se você inserir um tamanho amostral e um valor de poder, o Minitab calcula a diferença correspondente e exibe o valor calculado no gráfico.
Examine os valores na curva para determinar a diferença entre a média e o alvo que pode ser acomodada a um determinado valor de poder e tamanho amostral. Em geral, um valor de poder de 0,9 é considerado adequado. No entanto, alguns profissionais consideram o valor de poder de 0,8 como adequado. Se um teste de equivalência tiver baixo poder, talvez não seja possível demonstrar a equivalência mesmo se a média for equivalente ao alvo. Se você aumentar o tamanho amostral, o poder do teste também aumentará. Você quer observações suficientes na sua amostra para alcançar o poder adequado. Porém, você não quer um tamanho amostral tão grande a ponto de perder tempo e dinheiro em amostragens desnecessárias ou detectar diferenças sem importância para serem estatisticamente significativas. Normalmente, as diferenças que estão mais próximas aos limites de equivalência exigem mais poder para demonstrar a equivalência.