Interpretar os principais resultados para Teste t para 1 Amostra

Conclua as etapas a seguir para interpretar um teste t com 1 amostra. Os resultados principais incluem a estimativa da média, o intervalo de confiança, o valor de p e vários gráficos.

Etapa 1: Determine um intervalo de confiança para a média da população

Primeiro, considere a média da amostra e depois examine o intervalo de confiança.

A média dos dados das amostras é uma estimativa da média da população. Como a média é baseada em dados da amostra e não na população total, é improvável que a média da amostra seja igual à média da população. Para estimar melhor a média da população, use o intervalo de confiança.

O intervalo de confiança fornece um intervalo de valores possíveis para a média da população. Por exemplo, um nível de confiança de 95% indica que, se você extrair 100 amostras aleatórias da população, poderia esperar que, aproximadamente, 95 das amostras produza intervalos que contêm a média da população. O intervalo de confiança ajuda a avaliar a significância prática de seus resultados. Use seu conhecimento especializado para determinar se o intervalo de confiança inclui valores que tenham significância prática para a sua situação. Se o intervalo for muito amplo para ser útil, pense em aumentar o tamanho da amostra. Para obter mais informações, vá para Como obter um intervalo de confiança mais preciso.

Estatísticas Descritivas

NMédiaDesvPadEP MédiaIC de 95% para μ
25330,6154,230,8(266,9; 394,2)
μ: média de população de Custo da Energia
Principais resultados: média, IC de 95%

Nestes resultados, a estimativa da média da população para o custo de energia é 330,6. Você pode ter 95% de certeza de que a média da população está entre 266,9 e 394,2.

Etapa 2: Determine se os resultados do teste são estatisticamente significativos

Para determinar se a diferença entre a média da população e a média hipotética é estatisticamente significativa, compare o valor de p com o nível de significância. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica que o risco de se concluir que existe uma diferença, quando, na verdade, não existe nenhuma diferença real, é de 5%.
Valor de p ≤ α: A diferença entre as médias é estatisticamente significativa (rejeite H0)
Se o valor de p for menor ou igual ao nível de significância, você deve rejeitar a hipótese nula. É possível concluir que a diferença entre a média da população e a média hipotética é estatisticamente significativa. Use seu conhecimento especializado para determinar se a diferença é praticamente significativa. Para obter mais informações, acesse Significância estatística e prática.
Valor de p > α: A diferença entre as médias não é estatisticamente significativa (não deve rejeitar H0)
Se o valor de p for maior do que o nível de significância, você não deve rejeitar a hipótese nula. Não há evidências suficientes para concluir que a diferença entre a média da população e a média hipotética é estatisticamente significativa. Certifique-se de que o teste tenha poder suficiente para detectar uma diferença que seja significativa na prática. Para obter mais informações, acesse Poder e tamanho de amostra para teste t para 1 amostra.

Estatísticas Descritivas

NMédiaDesvPadEP MédiaIC de 95% para μ
25330,6154,230,8(266,9; 394,2)
μ: média de população de Custo da Energia

Teste

Hipótese nulaH₀: μ = 200
Hipótese alternativaH₁: μ ≠ 200
Valor-TValor-p
4,230,000
Resultados principais: valor-p

Nestes resultados, a hipótese nula afirma que o custo médio de energia é igual a 200. Como o valor-p é 0,00, que é menor de um alfa de 0,05, você pode rejeitar a hipótese nula e concluir que o custo médio da população é diferente de 200.

Etapa 3: Verifique se há problemas nos dados

Problemas com os dados, como assimetrias ou outliers, podem afetar desfavoravelmente seus resultados. Use gráficos para procurar assimetrias e para identificar os outliers potenciais.

Examine a dispersão de seus dados para determinar se eles parecem ser assimétricos.

Quando os dados são assimétricos, a maior parte dos dados está localizada no lado alto ou baixo do gráfico. Frequentemente, a assimetria é mais fácil de detectar com um histograma ou boxplot.

Assimétricos à direita
Assimétricos à esquerda

O histograma com dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O histograma com dados assimétricos à esquerda mostra os dados de tempos de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Os dados que são severamente assimétricos podem afetar a validade do valor-p se a amostra for pequena (menor que 20 valores). Se seus dados forem severamente assimétricos e você tiver uma pequena amostra, considere aumentar o tamanho amostral.

Neste histograma, os dados não parecem estar severamente assimétricos.

Identificar outliers

Outliers, que são valores de dados que estão longe dos outros valores de dados, podem afetar fortemente os resultados da análise. Geralmente, outliers são a maneira mais fácil de identificar em um boxplot.

Em um boxplot, os asteriscos (*) identificam outliers.

Tente identificar a causa de todos os outliers. Corrija quaisquer erros de entrada de dados ou de medição. Considere remover valores de dados que estejam associados a eventos anormais, que ocorrem somente uma vez (também chamados de causas especiais). Em seguida, repita a análise. Para obter mais informações, acesse Identificação de outliers.

Neste boxplot, não existem outliers.