Quando você quer determinar informações sobre uma característica específica da população (por exemplo, a média), normalmente você extrai uma amostra aleatória daquela população, porque é inviável medir toda a população. Usando esse exemplo, você calcula a característica da amostra correspondente, que é usada para resumir as informações sobre a característica desconhecida da população. A característica de interesse da população é chamada de parâmetro e a característica da amostra correspondente é a estatística da amostra ou parâmetro de estimativa. Como a estatística é um resumo das informações sobre um parâmetro obtido a partir da amostra, o valor de uma estatística depende da amostra particular que foi extraída da população. Os seus valores mudam aleatoriamente a partir de uma amostra aleatória para a seguinte, por conseguinte, uma estatística é uma quantidade aleatória (variável). A distribuição de probabilidade desta variável aleatória é chamada distribuição amostral. A distribuição amostral de uma (amostra) estatística é importante porque nos permite tirar conclusões sobre o parâmetro de população correspondente com base em uma amostra aleatória.
Por exemplo, quando extraímos uma amostra aleatória de uma população distribuída normalmente, a média da amostra é uma estatística. O valor da média da amostra com base na amostra em questão é uma estimativa da média da população. Este valor estimado irá mudar aleatoriamente se uma amostra diferente for extraída da mesma população normal. A distribuição de probabilidade que descreve essas mudanças é a distribuição amostral da média da amostra. A distribuição amostral de uma estatística especifica todos os possíveis valores de uma estatística e a frequência com que algum intervalo de valores da estatística ocorre. No caso em que a população de origem for normal, a distribuição de amostragem da média da amostra também é normal.
As seções a seguir fornecem mais informações sobre parâmetros, estimativas de parâmetros e distribuições amostrais.
Os parâmetros são medidas descritivas de toda uma população que podem ser usadas como entradas para uma função de distribuição de probabilidade (FDP) para gerar curvas de distribuição. Os parâmetros são normalmente representados por letras gregas para distingui-los de estatísticas amostrais. Por exemplo, a média populacional é representada pela letra grega mu (μ) e o desvio padrão da população pela letra grega sigma (σ). Os parâmetros são constantes fixas, isto é, eles não variam como as variáveis. Contudo, seus valores são normalmente desconhecidos, porque é inviável medir uma população inteira.
Distribuição | Parâmetro 1 | Parâmetro 2 | Parâmetro 3 |
---|---|---|---|
Qui-quadrado | Graus de liberdade | ||
Normal | Média | Desvio padrão | |
Gama de 3 parâmetros | Forma | Escala | Limite |
Os parâmetros são medidas descritivas de toda uma população. Contudo, seus valores são normalmente desconhecidos, porque é inviável medir uma população inteira. Por causa disso, é possível extrair uma amostra aleatória da população para obter estimativas de parâmetros. Um dos objetivos das análises estatísticas é a obtenção das estimativas dos parâmetros da população, juntamente com a quantidade de erro associada a essas estimativas. Essas estimativas também são conhecidas como estatísticas de amostra.
Para um exemplo de estimativas de parâmetros, suponha que você trabalha para um fabricante de velas de ignição que está estudando um problema na folga de sua vela de ignição. Seria muito caro para medir cada vela de ignição fabricada. Em vez disso, você faz uma amostragem aleatória de 100 velas de ignição e mede a folga em milímetros. A média da amostra é 9,2. Esta é a estimativa pontual para a média da população (μ). Você também pode criar um intervalo de confiança de 95% para μ que é (8,8, 9,6). Isso significa que você pode ter 95% de certeza de que o verdadeiro valor da folga média para todas as velas de ignição é entre 8,8 e 9,6.
Abóbora | 1 | 2 | 3 | 4 | 5 | 6 |
Peso | 19 | 14 | 15 | 12 | 16 | 17 |
Apesar de toda a população ser conhecida, para fins ilustrativos, tomamos todas as amostras aleatórias possíveis da população que contêm 3 abóboras (20 amostras aleatórias). Em seguida, calcula-se a média de cada amostra. A distribuição de amostras para a média da amostra é descrita por todas as médias de amostra, para cada amostra aleatória possível de 3 abóboras, o qual é mostrado na tabela a seguir.
Amostra | Pesos | Ponderação da média | Probabilidade |
---|---|---|---|
2, 3, 4 | 14, 15, 12 | 13,7 | 1/20 |
2, 4, 5 | 14, 12, 16 | 14 | 1/20 |
2, 4, 6 | 14, 12, 17 | 14,3 | 2/20 |
3, 4, 5 | 15, 12, 16 | ||
3, 4, 6 | 15, 12, 17 | 14,7 | 1/20 |
1, 2, 4 | 19, 14, 12 | 15 | 3/20 |
2, 3, 5 | 14, 15, 16 | ||
4, 5, 6 | 12, 16, 17 | ||
2, 3, 6 | 14, 15, 17 | 15,3 | 2/20 |
1, 3, 4 | 19, 15, 12 | ||
1, 4, 5 | 19, 12, 16 | 15,7 | 2/20 |
2, 5, 6 | 14, 16, 17 | ||
1, 2, 3 | 19, 14, 15 | 16 | 3/20 |
3, 5, 6 | 15, 16, 17 | ||
1, 4, 6 | 19, 12, 17 | ||
1, 2, 5 | 19, 14, 16 | 16,3 | 1/20 |
1, 2, 6 | 19, 14, 17 | 16,7 | 2/20 |
1, 3, 5 | 19, 15, 16 | ||
1, 3, 6 | 19, 15, 17 | 17 | 1/20 |
1, 5, 6 | 19, 16, 17 | 17,3 | 1/20 |
Na prática, é proibitivo e impraticável tabular a distribuição da distribuição de amostragem como no exemplo ilustrativo acima. Mesmo no melhor cenário em que você conheça a população de origem de suas amostras, talvez você não possa determinar a distribuição amostral exata da amostra estatística de interesse. No entanto, em alguns casos, é possível que você consiga aproximar a distribuição amostral da amostra estatística. Por exemplo, se você extrair amostra da população normal e, em seguida, a média da amostra tiver exatamente a distribuição normal.
Mas se você extrair a amostra de uma população diferente de população normal, talvez não seja capaz de determinar a distribuição exata da média da amostra. No entanto, por causa do teorema central do limite, a média da amostra é aproximadamente distribuída como normal, desde que suas amostras sejam grandes o suficiente. Então, se a população for desconhecida e suas amostras sejam grandes o suficiente, talvez você possa dizer, por exemplo, que há aproximadamente 85% de certeza de que a média da amostra esteja dentro de um determinado número de desvios padrão da média da população.