A diferença entre uma estatística da amostra e um valor hipotético é estatisticamente significativa se um teste de hipótese indicar que é muito improvável que tenha ocorrido por acaso. Para avaliar a significância estatística, examine o valor de p do teste. Se o valor de p for menor que um nível de significância especificado (α) (geralmente de 0,10, 0,05, ou 0,01), você pode declarar a diferença como estatisticamente significativa e rejeitar hipótese nula do teste.
Mas, se o valor de p for igual a 0,50, não é possível alegar significância estatística. Não há evidências suficientes para afirmar que a espessura média do para-brisas é maior que 4 mm.
A significância estatística em si não implica que seus resultados tenham consequências práticas. Se você usar um teste com alto poder, é possível concluir que uma pequena diferença a partir do valor hipotético é estatisticamente significativa. No entanto, essa pequena diferença pode ser sem sentido para a sua situação. Você deve usar seu conhecimento especializado para determinar se a diferença é praticamente significativa.
Por exemplo, suponha que você está testando se a média da população (μ) para horas trabalhadas em uma fábrica é igual a 8. Se μ não for igual a 8, a potência do teste se aproxima de 1 à medida que o tamanho amostral aumenta, e o valor p se aproxima de 0.
Com observações suficientes, mesmo as diferenças triviais entre os valores dos parâmetros hipotéticos e reais tendem a se tornar significativas. Por exemplo, suponha que o valor real de mu é de 7 horas, 59 minutos e 59 segundos. Com uma amostra grande o suficiente, você provavelmente irá rejeitar a hipótese nula de que μ é igual a 8 horas, mesmo que a diferença não tenha nenhuma importância prática.
Intervalos de confiança (se aplicáveis) são muitas vezes mais úteis do que os testes de hipóteses, porque eles fornecem uma maneira de avaliar a importância prática, além de significância estatística. Eles ajudam a dizer o que é um valor de parâmetro, em vez de explicar o que ele não é.