Estatísticas de teste de aleatorização e gráficos para Teste de aleatorização para média de 2 amostras

Encontre definições e guia de interpretação para todas as estatísticas de teste de aleatorização e gráficos fornecidos com o teste de aleatorização para média de 2 amostras.

Neste tópico

Histograma
Gráfico de valores individuais
Hipótese nula e hipótese alternativa
Número de Reamostras

Média
StDev (amostra por bootstrap)
Valor-p

Histograma

Um histograma divide os valores amostrais em diversos intervalos e representa a frequência dos valores de dados em cada intervalo com uma barra.

Interpretação

Use o histograma para examinar o formato de sua distribuição de bootstrap. A distribuição de bootstrap é a distribuição da estatística escolhida de cada reamostragem. A distribuição bootstrap deve parecer normal. Se a distribuição de bootstrap não for normal, não será possível confiar nos resultados do bootstrap.

A distribuição é geralmente mais fácil de determinar com mais reamostragens. Por exemplo, nesses dados, a distribuição é ambígua para 50 reamostragens. Com 1000 reamostragens, a forma parece aproximadamente normal.

O histograma mostra visualmente os resultados do teste de hipóteses. As amostras de aleatorização representam como seria uma amostra aleatória se as médias populacionais fossem iguais, portanto, o histograma é centrado em torno de 0. Para um teste unilateral, uma linha de referência é desenhada com a diferença nas médias da amostra original. Para um teste bilateral, uma linha de referência é desenhada pela diferença de médias da amostra original e à mesma distância no lado oposto de 0. O valor p é a proporção de diferenças de amostra que são mais extremas do que os valores nas linhas de referência. Em outras palavras, o valor-p é a proporção de diferenças de amostra que são tão extremas quanto sua amostra original ao assumir que a hipótese nula é verdadeira. Essas diferenças são coloridas em vermelho no histograma.

Neste histograma, a distribuição de bootstrap parece ser normal. Nenhuma das diferenças amostrais é maior que 21 ou menor que -21.

Gráfico de valores individuais

Um gráfico de valores individuais exibe os valores individuais na amostra. Cada círculo representa uma observação. Um gráfico de valores individuais é especialmente útil quando você tiver relativamente poucas observações e também precisar avaliar o efeito de cada observação.

Observação

O Minitab exibe um gráfico de valores individuais apenas quando você recebe só uma reamostra. O Minitab exibe os dados originais e os dados da reamostra.

Interpretação

Use o gráfico de valores individuais para comparar as amostras originais e as amostras de aleatorização. As amostras de aleatorização representam como seria uma amostra aleatória se as médias populacionais fossem iguais. Assim, a linha que conecta as médias das amostras de aleatorização tende a ser plana. Compare a diferença nas médias das amostras originais com a diferença nas médias das amostras de aleatorização. Quanto mais íngreme a linha entre as amostras observadas em relação à linha entre as amostras de aleatorização, mais evidências você esperaria contra a hipótese nula.

Hipótese nula e hipótese alternativa

As hipóteses nula e alternativa são duas declarações mutuamente exclusivas sobre uma população. Um teste de hipótese usa dados amostrais para determinar se deve rejeitar a hipótese nula.

Hipótese nula: A hipótese nula afirma que um parâmetro da população (como a média, o desvio padrão, e assim por diante) é igual a um valor hipotético. A hipótese nula é, muitas vezes, uma afirmação inicial baseada em análises anteriores ou no conhecimento especializado.
Hipótese alternativa: A hipótese alternativa afirma que um parâmetro da população é menor, maior ou diferente do valor hipotético na hipótese nula. A hipótese alternativa é aquela que você acredita que pode ser verdadeira ou espera provar ser verdadeira.

Método

μ₁: média de população de Classificação quando Hospital = A
µ₂: média de população de Classificação quando Hospital = B
Diferença: μ₁ - µ₂

Amostras observadas

Hospital	N	Média	DesvPad	Variância	Mínimo	Mediana	Máximo
A	20	80,30	8,18	66,96	62,00	79,00	98,00
B	20	59,30	12,43	154,54	35,00	58,50	89,00

Diferença nas médias observadas

Média de A - Média de B = 21,000

Teste por aleatorização

Hipótese nula	H₀: μ₁ - µ₂ = 0
Hipótese alternativa	H₁: μ₁ - µ₂ ≠ 0

Número de reamostras	Média	DesvPad	Valor-p
1000	-0,185	4,728	< 0,002

Nestes resultados, a hipótese nula é de que a diferença da população é igual a 0. A hipótese alternativa é que a diferença não é igual a 0.

Número de Reamostras

O número de reamostras é o número de vezes que o Minitab coleta uma amostra aleatória com a substituição do conjunto de dados original. Normalmente, um grande número de reamostras funciona melhor. O tamanho da amostra para cada reamostra é igual ao tamanho da amostra do conjunto de dados original. O número de reamostras é igual ao número de observações no histograma.

Média

A média é a soma de todas as diferenças nas médias da amostra de aleatorização dividida pelo número de reamostras. O Minitab exibe dois valores diferentes para a diferença nas médias, a diferença das amostras observadas e a diferença na distribuição de bootstrap (Média). Ambos os valores são uma estimativa da diferença nas médias populacionais e geralmente serão semelhantes. Se houver uma grande diferença entre esses dois valores, deve ser aumentado o tamanho da amostra original.

StDev (amostra por bootstrap)

O desvio padrão é a medida mais comum de dispersão, ou o quanto os dados estão dispersos sobre a média. O símbolo σ (sigma) é frequentemente usado para representar o desvio padrão de uma população, enquanto s é usado para representar o desvio padrão de uma amostra. A variação que é aleatória ou natural de um processo é frequentemente referida como ruído. Como o desvio padrão está nas mesmas unidades que os dados, ele é normalmente mais fácil de interpretar do que a variância.

O desvio padrão das amostras de bootstrap (também conhecido como erro padrão de bootstrap) é uma estimativa do desvio padrão da distribuição amostral da diferença de médias.

Interpretação

Use o desvio padrão para determinar o quão dispersas as diferenças da amostra de bootstrap estão da média global de diferenças. Um valor de desvio padrão mas alto indica maior dispersão nas diferenças. Uma boa regra de ouro de uma distribuição normal é que aproximadamente 68% dos valores estão dentro de um desvio padrão da média global das diferenças, 95% dos valores estão dentro de dois desvios padrão e 99,7% dos valores estão dentro de três desvios padrão.

Use o desvio padrão das amostras de bootstrap para determinar o quão precisamente as diferenças da amostra de bootstrap estimam a diferença de população em médias. Um valor menor indica uma estimativa mais precisa da diferença de população. Normalmente, um desvio padrão maior resulta em um erro padrão de bootstrap maior e uma estimativa menos precisa da diferença de população. Um tamanho amostral maior resulta em um erro padrão de bootstrap menor e em uma estimativa mais precisa da diferença de população.

Valor-p

O valor-p é a proporção de diferenças de amostra que são tão extremas quanto sua amostra original ao assumir que a hipótese nula é verdadeira. Um valor-p menor fornece uma evidência mais forte contra a hipótese nula.

Interpretação

Use o valor-p para determinar se a diferença de médias da população é estatisticamente significativa. Para determinar se a diferença entre as médias da população é estatisticamente significativa, compare o valor-p com o nível de significância. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica que o risco de se concluir que existe uma diferença, quando, na verdade, não existe nenhuma diferença real, é de 5%.

Valor-p ≤ α: A diferença entre as médias é estatisticamente significativa (rejeite H₀): Se o valor-p for menor ou igual ao nível de significância, você deve rejeitar a hipótese nula. É possível concluir que a diferença entre as médias da população é estatisticamente significativa. Para calcular o intervalo de confiança e determinar se a diferença apresenta significância prática, use Boostrapping para média de 2 amostras. Para obter mais informações, acesse Significância prática e estatística.
Valor-p > α: A diferença entre as médias não é estatisticamente significativa (não deve rejeitar H₀): Se o valor-p for maior do que o nível de significância, você não deve rejeitar a hipótese nula. Não há evidências suficientes para concluir que a diferença entre as médias da população é estatisticamente significativa.

Estatísticas de teste de aleatorização e gráficos para Teste de aleatorização para média de 2 amostras

Neste tópico

Histograma

Interpretação

50 reamostras

1000 reamostras

Gráfico de valores individuais

Observação

Interpretação

As médias populacionais são iguais

A média populacional do grupo 1 é duas vezes maior que a média populacional do grupo 2

Hipótese nula e hipótese alternativa

Método

Amostras observadas

Diferença nas médias observadas

Teste por aleatorização

Número de Reamostras

Média

StDev (amostra por bootstrap)

Interpretação

Valor-p

Interpretação