Amostras devem ser aleatórias

Uma amostra aleatória é um subconjunto de uma população selecionada por um processo que torna igualmente provável a ocorrência de todas as amostras de um tamanho especificado. Em estatística, utiliza-se uma amostra aleatória para fazer generalizações, ou inferências, sobre uma população.

Entretanto, uma amostra deve ser coletada aleatoriamente para representar a população de onde é retirada de maneira precisa. Você deve planejar seu processo de coleta de dados cuidadosamente para assegurar que a amostra seja aleatória. Além disso, o processo ou a população de onde os dados são retirados deve ser estável.

As amostras devem ser aleatórias para eliminar o vício da seleção. O vício da seleção significa que alguns sujeitos apresentam maior probabilidade de estar na amostra do que outros sujeitos. Se a amostra estiver viciada, só é possível fazer inferências sobre os indivíduos da amostra, e não sobre toda a população.

Suponha que você deseja iniciar uma nova campanha publicitária mas não sabe ao certo qual é o melhor veículo para atingir seus clientes: material impresso, rádio ou televisão. Embora não seja prático ou econômico pesquisar todos os clientes, é possível pesquisar uma amostra aleatória. Inicialmente você está inclinado a pesquisar somente os clientes que responderam a uma promoção pelo correio porque esses clientes têm mais probabilidade de responder a uma pesquisa. Entretanto, essa amostra não representa a população toda porque nem todos os clientes têm a mesma chance de serem selecionados. Isso poderia levar a decisões de negócio ruins. Ao invés disso, você decide selecionar clientes aleatoriamente em uma lista alfabética de todos os clientes. Com esses dados você poderá fazer inferências sobre a sua base de clientes para determinar a melhor maneira de alocar sua verba publicitária.

Determine se uma amostra é aleatória usando um teste de runs

Após coletar os dados, uma forma de testar se os dados são aleatórios é usar um teste de ensaios para procurar por um padrão nos dados ao longo do tempo. Para realizar um teste de ensaios no Minitab, escolha Estat > Não paramétricos > Teste de ensaios.

Existem também outros gráficos que permitem identificar se uma amostra é aleatória.

Exemplo de uso de série temporal para determinar que os dados não são aleatórios

Suponha que um entrevistador seleciona aleatoriamente 30 pessoas e faz a cada uma uma pergunta para a qual existe quatro respostas possíveis. Suas respostas são codificadas como 0, 1, 2, 3. O entrevistador cria uma gráfico de série temporal para verificar a aleatoriedade das respostas.

Gráfico de série temporal de respostas

O padrão nos dados indica que os dados não são aleatórios. O entrevistador investiga para determinar se existe um vício na elaboração das perguntas ou na seleção dos entrevistados.