Estatísticas e gráficos da amostra por bootstrap para Bootstrap para função de uma amostra

Encontre definições e orientações de interpretação para cada estatística e gráfico da amostra por bootstrap fornecidos com o bootstrapping para a função de 1 amostra.

Histograma

Um histograma divide os valores amostrais em diversos intervalos e representa a frequência dos valores de dados em cada intervalo com uma barra.

Interpretação

Use o histograma para examinar a forma da sua distribuição bootstrap. A distribuição bootstrap é a distribuição da estatística escolhida de cada reamostra. A distribuição bootstrap deve ter aparência normal. Se a distribuição bootstrap for não normal, não é possível confiar nos resultados.
50 reamostras
1000 reamostras

Normalmente, é mais fácil determinar a distribuição com mais reamostras. Por exemplo, nesses dados, a distribuição é ambígua para 50 amostras. Com 1000 reamostras, a forma parece aproximadamente normal.

Neste histograma, a distribuição de bootstrap não parece ser normal. A amostra original tem somente 16 pontos de dados. Para obter um intervalo de confiança, é necessário coletar uma amostra maior e realizar a análise novamente.

Gráfico de valores individuais

Um gráfico de valores individuais exibe os valores individuais na amostra. Cada círculo representa uma observação. Um gráfico de valores individuais é especialmente útil quando você tiver relativamente poucas observações e também precisar avaliar o efeito de cada observação.

Observação

O Minitab mostra um gráfico de valores individuais apenas quando você coleta somente uma reamostra. O Minitab exibe os dados originais e os dados da reamostra.

Interpretação

Com um tamanho de amostra grande, a amostra de bootstrap normalmente terá um centro e dispersão similares aos da amostra original. Entretanto, um tamanho de amostra pequeno pode resultar em uma amostra de bootstrap que não é similar à amostra original. Se sua amostra de bootstrap não se parece com sua amostra original, considere aumentar o tamanho da sua amostra.
Tamanho amostral 8
Tamanho amostral 50

Gráfico de barras

O gráfico de barras mostra a proporção de ocorrências para cada categoria.

Observação

O Minitab exibe um gráfico de barras quando você recebe apenas uma reamostra. O Minitab exibe os dados originais e os dados da reamostra.

Interpretação

Com um tamanho de amostra grande, a amostra de bootstrap normalmente terá proporções similares às da amostra original. Entretanto, um tamanho de amostra pequeno pode resultar em uma amostra de bootstrap que não é similar à amostra original. Se sua amostra de bootstrap não se parece com sua amostra original, considere aumentar o tamanho da sua amostra.
Tamanho amostral 8
Tamanho amostral 50

Número de Reamostras

O número de reamostras é o número de vezes que o Minitab coleta uma amostra aleatória com a substituição do conjunto de dados original. Normalmente, um grande número de reamostras funciona melhor. O tamanho da amostra para cada reamostra é igual ao tamanho da amostra do conjunto de dados original. O número de reamostras é igual ao número de observações no histograma.

Média

A média é a soma de todas as estatísticas escolhidas nas médias da amostra de bootstrapping, dividida pelo número de reamostras.

Interpretação

O Minitab exibe dois valores da diferença das estatísticas escolhidas, o valor da amostra observada e o valor da distribuição de bootstrap (Média). Ambos valores são uma estimativa do parâmetro da população e normalmente serão similares. Se houver uma diferença grande entre estes dois valores, você deve aumentar o tamanho da amostra de sua amostra original.

Como a média está baseada em dados da amostra e não da população total, é improvável que a média seja igual ao parâmetro da população. Para estimar melhor o parâmetro da população, use o intervalo de confiança.

StDev (amostra por bootstrap)

O desvio padrão das amostras de bootstrap (também conhecido como erro padrão do bootstrap) é uma estimativa do desvio padrão de uma distribuição amostral da estatística escolhida.

Interpretação

Use o desvio padrão para determinar quão dispersa a estatística escolhida está em relação à média geral. Um valor alto de desvio padrão indica uma dispersão maior.

Use o desvio padrão das amostras de bootstrap para determinar quão precisamente a estatística de bootstrap estima o parâmetro da população. Um valor menor indica uma estimativa mais precisa do parâmetro populacional. Um tamanho amostral maior resulta em um erro padrão de bootstrap menor e uma estimativa mais precisa do parâmetro populacional.

Intervalo de confiança (IC) e limites

Os intervalos de confiança são baseados na distribuição de amostragem de uma estatística. Se uma estatística não tem viés como um estimador de um parâmetro, sua distribuição de amostragem estará centrada no valor verdadeiro do parâmetro. Uma distribuição bootstrap aproxima a distribuição amostral da estatística. Portanto, o meio dos 95% dos valores da distribuição bootstrap fornece um intervalo de confiança a 95% para o parâmetro. O intervalo de confiança ajuda a avaliar a significância prática de sua estimativa do parâmetro populacional. Use seu conhecimento especializado para determinar se o intervalo de confiança inclui valores que tenham significância prática para a sua situação.

Observação

O Minitab não calcula o intervalo de confiança quando o número de reamostras é muito pequeno para obter um intervalo de confiança preciso.

Amostra observada

VariávelNMédiaDesvPadVariânciaSomaMínimoMedianaMáximo
Time1611,3313,1159,702181,3007,70010,05016,000

Amostras por bootstrap da média

Número de
reamostras
MédiaDesvPadIC de 95% para μ
100011,30950,7625(9,8562; 12,8562)

Nestes resultados, a estimativa para a média populacional é aproximadamente 11,3. Você pode ter 95% de confiança que a média da população está entre aproximadamente 9,9 e 12,9.