Estatísticas e gráficos de teste de aleatorização para Teste de aleatorização para média de 1 amostra

Encontre definições e orientações de interpretação para cada estatística e gráfico de teste de aleatorização fornecidos com o teste de aleatorização para a média de 1 amostra.

Histograma

Um histograma divide os valores amostrais em diversos intervalos e representa a frequência dos valores de dados em cada intervalo com uma barra.

Interpretação

Use o histograma para examinar a forma da sua distribuição bootstrap. A distribuição bootstrap é a distribuição da diferença das médias de cada reamostra. A distribuição bootstrap deve ter aparência normal. Se a distribuição bootstrap for não normal, não é possível confiar nos resultados.
50 reamostras
1000 reamostras

Normalmente, é mais fácil determinar a distribuição com mais reamostras. Por exemplo, nesses dados, a distribuição é ambígua para 50 amostras. Com 1000 reamostras, a forma parece aproximadamente normal.

O histograma mostra visualmente os resultados do teste de hipóteses. O Minitab ajusta os dados para que o centro das reamostras seja o mesmo que da média hipotética. Para um teste unilateral, é traçada uma linha de referência na média da amostra original. Para um teste bilateral, é traçada uma linha de referência na média da amostra original e à mesma distância no lado oposto da média hipotética. O valor-p é a proporção das médias das amostras que têm o mesmo alcance dos valores nas linhas de referência. Em outras palavras, o valor-p é a proporção das médias das amostras que têm o mesmo alcance de sua amostra original ao assumir que a hipótese nula é verdadeira. Essas médias aparecem em vermelho no histograma.

Neste histograma, a distribuição bootstrap parece ser normal. O valor-p de 0,2030 indica que 20,3% das médias da amostra são menores que a média da amostra original.

Gráfico de valores individuais

Um gráfico de valores individuais exibe os valores individuais na amostra. Cada círculo representa uma observação. Um gráfico de valores individuais é especialmente útil quando você tiver relativamente poucas observações e também precisar avaliar o efeito de cada observação.

Observação

O Minitab mostra um gráfico de valores individuais apenas quando você coleta somente uma reamostra. O Minitab exibe os dados originais e os dados da reamostra.

Interpretação

O Minitab ajusta os dados para que o centro das reamostras seja o mesmo que da média hipotética. Primeiro, o Minitab calcula a diferença entre a média hipotética e a média da amostra original. Em seguida, o Minitab adiciona ou subtrai a diferença a cada valor na amostra original. As reamostras são extraídas destes dados ajustados.

Use o gráfico de valores individuais para comparar a amostra original e a amostra aleatorizada. A amostra por aleatorização representa como seria uma amostra aleatória se a média da população fosse igual ao valor hipotético (a hipótese nula é verdadeira). Quanto maior a diferença entre os centros das duas amostras, maior a probabilidade de evidências contra a hipótese nula.
A média da amostra é igual à média hipotética
A média da amostra é 2 desvios padrões menor que a média hipotética

Hipótese nula e hipótese alternativa

As hipóteses nula e alternativa são duas declarações mutuamente exclusivas sobre uma população. Um teste de hipótese usa dados amostrais para determinar se deve rejeitar a hipótese nula.
Hipótese nula
A hipótese nula afirma que um parâmetro da população (como a média, o desvio padrão, e assim por diante) é igual a um valor hipotético. A hipótese nula é, muitas vezes, uma afirmação inicial baseada em análises anteriores ou no conhecimento especializado.
Hipótese alternativa
A hipótese alternativa afirma que um parâmetro da população é menor, maior ou diferente do valor hipotético na hipótese nula. A hipótese alternativa é aquela que você acredita que pode ser verdadeira ou espera provar ser verdadeira.

Interpretação

Na saída, as hipóteses nula e alternativa ajudam a verificar se você inseriu o valor correto para a média hipotética.

Amostra observada

VariávelNMédiaDesvPadVariânciaSomaMínimoMedianaMáximo
Time1611,3313,1159,702181,3007,70010,05016,000

Teste por aleatorização

Hipótese nulaH₀: μ = 12
Hipótese alternativaH₁: μ < 12
Número de
reamostras
MédiaDesvPadValor-p
100011,97830,76250,199

Nestes resultados, a hipótese nula é de que a média da população é igual a 12. A hipótese alternativa é que a média seja menor do que 12.

Número de reamostras

O número de reamostras é o número de vezes que o Minitab coleta uma amostra aleatória com a substituição do conjunto de dados original. Em geral, a utilização de um alto número de reamostras apresenta melhores resultados.

O Minitab ajusta os dados para que o centro das reamostras seja o mesmo que da média hipotética. Primeiro, o Minitab calcula a diferença entre a média hipotética e a média da amostra original. Em seguida, o Minitab adiciona ou subtrai a diferença a cada valor na amostra original. As reamostras são extraídas destes dados ajustados. O tamanho amostral para cada reamostra é igual ao tamanho da amostra do conjunto de dados original. O número de reamostras é igual ao número de observações no histograma.

Média

A média é a soma de todas as diferenças nas médias da amostra por bootstrap, dividida pelo número de reamostras. O Minitab ajusta os dados para que o centro das reamostras seja o mesmo que da média hipotética.

Interpretação

O Minitab exibe dois valores diferentes de média, a média da amostra observada e a média da distribuição bootstrap. A média dos dados da amostra observada é uma estimativa da média da população. A média da distribuição bootstrap é geralmente próxima da média hipotética. Quanto maior for a diferença entre estes dois valores, maior será a evidência contra a hipótese nula.

StDev (amostra por bootstrap)

O desvio padrão é a medida mais comum de dispersão, ou o quanto os dados estão dispersos sobre a média. O símbolo σ (sigma) é frequentemente usado para representar o desvio padrão de uma população, enquanto s é usado para representar o desvio padrão de uma amostra. A variação que é aleatória ou natural de um processo é frequentemente referida como ruído. Como o desvio padrão está nas mesmas unidades que os dados, ele é normalmente mais fácil de interpretar do que a variância.

O desvio padrão das amostras por bootstrap (também conhecido como erro padrão do bootstrap) é uma estimativa do desvio padrão de uma distribuição amostral da média. Como o erro padrão por bootstrap é a variação das médias da amostra, onde o desvio padrão das amostras observadas é a variação das observações individuais, o erro padrão de bootstrap é menor.

Interpretação

Use o desvio padrão para determinar quão dispersa as médias da amostra por bootstrap estão em relação à média geral. Um valor de desvio padrão mais alto indica maior dispersão nas médias. Uma boa regra de ouro de uma distribuição normal é que aproximadamente 68% dos valores estão dentro de um desvio padrão da média geral, 95% dos valores estão dentro de dois desvios padrão e 99,7% dos valores estão dentro de três desvios padrão.

Use o desvio padrão das amostras por bootstrap para estimar a precisão das médias por bootstrap. Um valor menor indica mais precisão. Um desvio padrão maior na amostra original geralmente resulta em um erro padrão de bootstrap maior e em um teste de hipóteses menos poderoso. Um tamanho amostral menor geralmente também resulta em um erro padrão de bootstrap maior e em um teste de hipóteses menos poderoso.

O desvio padrão também pode ser usado para estabelecer um benchmark para estimativa da variação global de um processo.
Hospital 1
Hospital 2
Tempos de alta de hospital

Os administradores controlam o tempo gasto na alta de pacientes tratados nos departamentos de emergência de dois hospitais. Apesar de os tempos médios de alta serem quase os mesmos (35 minutos), os desvios padrão são significativamente diferentes. O desvio padrão do hospital 1 é de cerca de 6. Em média, o tempo de alta de um paciente se desvia da média (linha tracejada) em cerca de 6 minutos. O desvio padrão do hospital 2 é de cerca de 20. Na média, um tempo de alta de um paciente se desvia da média (linha tracejada) em cerca de 20 minutos.

Valor-p

O valor-p é a proporção de médias da amostra que são tão extremas quanto a sua amostra original, quando você assume que a hipótese nula é verdadeira. Um valor-p menor fornece uma evidência mais forte contra a hipótese nula.

Interpretação

Use o valor-p para determinar se a média da população é estatisticamente diferente da média hipotética.

Para determinar se a diferença entre a média da população e a média hipotética é estatisticamente significativa, compare o valor-p com o nível de significância. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica que o risco de se concluir que existe uma diferença, quando, na verdade, não existe nenhuma diferença real, é de 5%.
Valor-p ≤ α: A diferença entre as médias é estatisticamente significativa (rejeite H0)
Se o valor-p for menor ou igual ao nível de significância, você deve rejeitar a hipótese nula. É possível concluir que a diferença entre a taxa da população e a taxa hipotética é estatisticamente significativa. Para calcular um intervalo de confiança e determinar se a diferença tem significância prática, use Bootstrap para função de uma amostra. Para obter mais informações, acesse Significância prática e estatística.
Valor-p > α: A diferença entre as médias não é estatisticamente significativa (não deve rejeitar H0)
Se o valor-p for maior do que o nível de significância, você não deve rejeitar a hipótese nula. Não há evidências suficientes para concluir que a diferença entre a média da população e a média hipotética é estatisticamente significativa.