Interpretar todas as estatísticas e gráficos para Teste Z para 1 amostra

Encontre definições e orientações de interpretação para cada estatística e gráfico fornecido com a análise de teste Z com 1 amostra.

qHipótese nula e hipótese alternativa

As hipóteses nula e alternativa são duas declarações mutuamente exclusivas sobre uma população. Um teste de hipótese usa dados amostrais para determinar se deve rejeitar a hipótese nula.
Hipótese nula
A hipótese nula afirma que um parâmetro da população (como a média, o desvio padrão, e assim por diante) é igual a um valor hipotético. A hipótese nula é, muitas vezes, uma afirmação inicial baseado em análises anteriores ou no conhecimento especializado.
Hipótese alternativa
A hipótese alternativa afirma que um parâmetro da população é menor, maior ou diferente do valor hipotético na hipótese nula. A hipótese alternativa é aquela que você acredita que pode ser verdadeira ou espera provar ser verdadeira.

Na saída, as hipóteses nula e alternativa ajudam a verificar se você inseriu o valor correto para a média hipotética.

Desvio padrão

O desvio padrão é a medida mais comum de dispersão, ou o quanto os dados estão dispersos sobre a média. O símbolo σ (sigma) é frequentemente usado para representar o desvio padrão de uma população, enquanto s é usado para representar o desvio padrão de uma amostra. A variação que é aleatória ou natural de um processo é frequentemente referida como ruído.

O desvio padrão usa as mesmas unidades que os dados.

Interpretação

Use o desvio padrão para determinar o grau de dispersão dos dados a partir da média. Um valor de desvio padrão mais alto indica maior dispersão nos dados. Uma boa regra de ouro de uma distribuição normal é que aproximadamente 68% dos valores estão dentro de um desvio padrão da média, 95% dos valores estão dentro de dois desvios padrão e 99,7% dos valores estão dentro de três desvios padrão.

O Minitab exibe dois valores diferentes para o desvio padrão. O desvio padrão conhecido é o desvio padrão da população que você inseriu antes de realizar a análise. O desvio padrão é usado para calcular os intervalos de confiança e o valor Z. DesvPad é o desvio padrão dos dados das amostras. Como você conhece o desvio padrão da população, o Minitab não usa o valor da amostra para nenhum dos cálculos.

Se você não conhece o desvio padrão da população, use Teste t para 1 Amostra.

N

O tamanho amostral (N) é o número total de observações na amostra.

Interpretação

O tamanho amostral afeta o intervalo de confiança e o poder do teste.

Normalmente, um tamanho amostral grande resulta em um intervalo mais estreito. Uma amostra maior também proporciona ao teste mais poder para detectar uma diferença. Para obter mais informações, vá para O que é potência?.

Média

A média sumariza os valores das amostras com um único valor que representa o centro dos dados. A média é a média dos dados, que é a soma de todas as observações divididas pelo número de observações.

Interpretação

A média dos dados das amostras é uma estimativa da média da população.

Como a média é baseada em dados da amostra e não na população total, é improvável que a média da amostra seja igual à média da população. Para estimar melhor a média da população, use o intervalo de confiança.

EP Média

O erro padrão da média (SE Média) estima a variabilidade entre a amostra média que você obteria se você tivesse extraído repetidas amostras da mesma população. Considerando-se que o erro padrão da média estima a variabilidade entre as amostras, o desvio padrão mede a variabilidade dentro de uma única amostra.

Por exemplo, você tem um tempo médio de entrega de 3,80 dias, com um desvio padrão de 1,43 dias, a partir de uma amostra aleatória de 312 prazos de entrega. Estes números produzem um erro padrão da média de 0,08 dias (1,43 dividido pela raiz quadrada de 312). Se você extraiu várias amostras aleatórias do mesmo tamanho da mesma população, o desvio padrão dessas médias diferentes de amostra seria de cerca de 0,08 dias.

Interpretação

Use o erro padrão da média para determinar o quão precisamente a média da amostra estima a média da população.

Um valor menor do erro padrão da média indica uma estimativa mais precisa da média da população. Normalmente, um desvio padrão maior resulta em um erro padrão maior da média e uma estimativa menos precisa da média da população. A amostra de tamanho maior resulta em um erro padrão menor da média e uma estimativa mais precisa da média da população.

O Minitab utiliza o erro padrão da média para calcular o intervalo de confiança.

Intervalo de confiança (IC) e limites

O intervalo de confiança fornece um intervalo de valores possíveis para a média da população. Como as amostras são aleatórias, é improvável que duas amostras de uma população produzam intervalos de confiança idênticos. Porém, se você repetir sua amostra muitas vezes, uma certa porcentagem dos intervalos ou fronteiras de confiança resultantes contém a média da população desconhecida. A porcentagem destes intervalos de confiança ou fronteiras que contêm a média é o nível de confiança do intervalo. Por exemplo, um nível de confiança de 95% indica que, se você extrair 100 amostras aleatórias da população, poderia esperar que, aproximadamente, 95 das amostras produza intervalos que contêm a média da população.

Uma fronteira superior define um valor provável que a média da população seja menor. Uma fronteira inferior define um valor provável que a média da população seja maior.

O intervalo de confiança ajuda a avaliar a significância prática de seus resultados. Use seu conhecimento especializado para determinar se o intervalo de confiança inclui valores que tenham significância prática para a sua situação. Se o intervalo for muito amplo para ser útil, pense em aumentar o tamanho da amostra. Para obter mais informações, vá para Como obter um intervalo de confiança mais preciso.

Estatísticas Descritivas

NMédiaDesvPadEP MédiaIC de 95% para μ
2016,4602,2580,581(15,321; 17,599)
μ: média de população de Percentual de Gordura
Desvio padrão conhecido = 2,6

Nestes resultados, a estimativa da média da população para porcentagem de gordura é de 16,46%. Você pode ter 95% de confiança de que a média da população está entre 15,321% e 17,599%.

Valor-z

O valor-z é uma estatística de teste para testes Z que mede a diferença entre uma estatística observada e seu parâmetro de população em unidades de erro padrão.

Interpretação

Você pode comparar o valor-z a valores críticos da distribuição normal padrão a fim de determinar se deve rejeitar a hipótese nula. No entanto, o uso do valor-p do teste para fazer a mesma determinação é geralmente mais prático e conveniente.

Para determinar se a hipótese nula deve ser rejeitada, compare o valor-z com seu valor crítico. O valor crítico é Z1-α/2 para um teste bilateral e Z1-α para um teste unilateral. Para um teste bilateral, se o valor absoluto do valor-z for maior do que o valor crítico, você deve rejeitar a hipótese nula. Se o valor absoluto do valor-z for menor do que o valor crítico, você não deve rejeitar a hipótese nula. Você pode calcular o valor crítico no Minitab ou encontrar o valor crítico de uma tabela normal padrão na maioria dos livros de estatística. Para obter mais informações, acesse Usando a função de distribuição acumulada inversa (ICDF) e clique em "Usar o ICDF para calcular valores críticos".

O valor-z é usado para calcular o valor-p.

Valor-p

O valor de p é uma probabilidade que mede a evidência contra a hipótese nula. Um valor de p menor fornece uma evidência mais forte contra a hipótese nula.

Interpretação

Use o valor de p para determinar se a média da população é estatisticamente diferente da média hipotética.

Para determinar se a diferença entre a média da população e a média hipotética é estatisticamente significativa, compare o valor de p com o nível de significância. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica que o risco de se concluir que existe uma diferença, quando, na verdade, não existe nenhuma diferença real, é de 5%.
Valor de p ≤ α: A diferença entre as médias é estatisticamente significativa (rejeite H0)
Se o valor de p for menor ou igual ao nível de significância, você deve rejeitar a hipótese nula. É possível concluir que a diferença entre a média da população e a média hipotética é estatisticamente significativa. Use seu conhecimento especializado para determinar se a diferença é praticamente significativa. Para obter mais informações, acesse Significância estatística e prática.
Valor de p > α: A diferença entre as médias não é estatisticamente significativa (não deve rejeitar H0)
Se o valor de p for maior do que o nível de significância, você não deve rejeitar a hipótese nula. Não há evidências suficientes para concluir que a diferença entre a média da população e a média hipotética é estatisticamente significativa. Certifique-se de que o teste tenha poder suficiente para detectar uma diferença que seja significativa na prática. Para obter mais informações, acesse Poder e tamanho de amostra para teste Z para 1 amostra.

Histograma

Um histograma divide valores de amostra para muitos intervalos e representa a frequência de valores de dados em cada intervalo com uma barra.

Interpretação

Utilize um histograma para avaliar a forma e a dispersão dos dados. Os histogramas são melhores quando o tamanho amostral for superior a 20.

Dados Assimétricos

Examine a dispersão de seus dados para determinar se eles parecem ser assimétricos. Quando os dados são assimétricos, a maioria dos dados está localizada no lado alto ou baixo do gráfico. Muitas vezes, é mais fácil detectar a assimetria com um histograma ou boxplot.

Assimétrico à direita
Assimétrico à esquerda

O histograma com dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O histograma com dados assimétricos à esquerda mostram dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Os dados que são extremamente assimétricos podem afetar a validade do valor de p se a sua amostra for pequena (menos de 20 valores). Se seus dados forem extremamente assimétricos e você tiver uma amostra pequena, considere aumentar o tamanho amostral.

Outliers

Outliers, que são valores de dados que estão distantes de outros valores de dados, podem afetar fortemente os resultados de sua análise. Muitas vezes, os outliers são mais fáceis de serem identificados em um boxplot.

Em um histograma, barras isoladas em ambas as extremidades do gráfico identificam possíveis outliers.

Tente identificar a causa de todos os outliers. Corrija todos os erros de entrada de dados ou de medição. Considere a remoção de valores de dados para eventos anormais de ocorrência única (também chamados de causas especiais). Depois, repita a análise. Para obter mais informações, acesse Identificação de outliers.

Gráfico de valores individuais

Um gráfico de valores individuais exibe os valores individuais na amostra. Cada círculo representa uma observação. Um gráfico de valores individuais é especialmente útil quando você tem relativamente poucas observações e também precisa avaliar o efeito de cada observação.

Interpretação

Utilize um gráfico de valores individuais para examinar a dispersão dos dados e identificar os outliers potenciais. Os gráficos de valores individuais são melhores quando o tamanho amostral for inferior a 50.

Dados Assimétricos

Examine a dispersão de seus dados para determinar se eles parecem ser assimétricos. Quando os dados são assimétricos, a maioria dos dados está localizada no lado alto ou baixo do gráfico. Muitas vezes, é mais fácil detectar a assimetria com um histograma ou boxplot.

Assimétrico à direita
Assimétrico à esquerda

O gráfico de valores individuais com dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O gráfico de valores individuais com dados assimétricos à esquerda mostram dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Os dados que são extremamente assimétricos podem afetar a validade do valor de p se a sua amostra for pequena (menos de 20 valores). Se seus dados forem extremamente assimétricos e você tiver uma amostra pequena, considere aumentar o tamanho amostral.

Outliers

Outliers, que são valores de dados que estão distantes de outros valores de dados, podem afetar fortemente os resultados de sua análise. Muitas vezes, os outliers são mais fáceis de serem identificados em um boxplot.

Em um gráfico de valores individuais, os valores de dados anormalmente baixos ou altos indicam possíveis outliers.

Tente identificar a causa de todos os outliers. Corrija todos os erros de entrada de dados ou de medição. Considere a remoção de valores de dados para eventos anormais de ocorrência única (também chamados de causas especiais). Depois, repita a análise. Para obter mais informações, acesse Identificação de outliers.

Boxplot

Um boxplot fornece um resumo gráfico da distribuição de uma amostra. O boxplot mostra a forma, a tendência central e a variabilidade dos dados.

Interpretação

Utilize um boxplot para examinar a dispersão dos dados e identificar todos os outliers potenciais. Os boxplots são melhores quando o tamanho amostral for superior a 20.

Dados Assimétricos

Examine a dispersão de seus dados para determinar se eles parecem ser assimétricos. Quando os dados são assimétricos, a maioria dos dados está localizada no lado alto ou baixo do gráfico. Muitas vezes, é mais fácil detectar a assimetria com um histograma ou boxplot.

Assimétrico à direita
Assimétrico à esquerda

O boxplot com dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O boxplot com dados assimétricos à esquerda mostram dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Os dados que são extremamente assimétricos podem afetar a validade do valor de p se a sua amostra for pequena (menos de 20 valores). Se seus dados forem extremamente assimétricos e você tiver uma amostra pequena, considere aumentar o tamanho amostral.

Outliers

Outliers, que são valores de dados que estão distantes de outros valores de dados, podem afetar fortemente os resultados de sua análise. Muitas vezes, os outliers são mais fáceis de serem identificados em um boxplot.

Em um boxplot, asteriscos (*) denotam outliers.

Tente identificar a causa de todos os outliers. Corrija todos os erros de entrada de dados ou de medição. Considere a remoção de valores de dados para eventos anormais de ocorrência única (também chamados de causas especiais). Depois, repita a análise. Para obter mais informações, acesse Identificação de outliers.