Aleatoriedade em amostras de dados

Neste tópico

Amostras devem ser aleatórias
Determine se uma amostra é aleatória usando um teste de runs

Amostras devem ser aleatórias

Uma amostra aleatória é um subconjunto de uma população selecionada por um processo que torna igualmente provável a ocorrência de todas as amostras de um tamanho especificado. Em estatística, utiliza-se uma amostra aleatória para fazer generalizações, ou inferências, sobre uma população.

Entretanto, uma amostra deve ser coletada aleatoriamente para representar a população de onde é retirada de maneira precisa. Você deve planejar seu processo de coleta de dados cuidadosamente para assegurar que a amostra seja aleatória. Além disso, o processo ou a população de onde os dados são retirados deve ser estável.

As amostras devem ser aleatórias para eliminar o vício da seleção. O vício da seleção significa que alguns sujeitos apresentam maior probabilidade de estar na amostra do que outros sujeitos. Se a amostra estiver viciada, só é possível fazer inferências sobre os indivíduos da amostra, e não sobre toda a população.

Suponha que você deseja iniciar uma nova campanha publicitária mas não sabe ao certo qual é o melhor veículo para atingir seus clientes: material impresso, rádio ou televisão. Embora não seja prático ou econômico pesquisar todos os clientes, é possível pesquisar uma amostra aleatória. Inicialmente você está inclinado a pesquisar somente os clientes que responderam a uma promoção pelo correio porque esses clientes têm mais probabilidade de responder a uma pesquisa. Entretanto, essa amostra não representa a população toda porque nem todos os clientes têm a mesma chance de serem selecionados. Isso poderia levar a decisões de negócio ruins. Ao invés disso, você decide selecionar clientes aleatoriamente em uma lista alfabética de todos os clientes. Com esses dados você poderá fazer inferências sobre a sua base de clientes para determinar a melhor maneira de alocar sua verba publicitária.

Determine se uma amostra é aleatória usando um teste de runs

Após coletar os dados, uma forma de testar se os dados são aleatórios é usar um teste de ensaios para procurar por um padrão nos dados ao longo do tempo. Para realizar um teste de ensaios no Minitab, escolha Estat > Não paramétricos > Teste de ensaios.

Existem também outros gráficos que permitem identificar se uma amostra é aleatória.

Exemplo de uso de série temporal para determinar que os dados não são aleatórios

Suponha que um entrevistador seleciona aleatoriamente 30 pessoas e faz a cada uma uma pergunta para a qual existe quatro respostas possíveis. Suas respostas são codificadas como 0, 1, 2, 3. O entrevistador cria uma gráfico de série temporal para verificar a aleatoriedade das respostas.

Gráfico de série temporal de respostas
O padrão nos dados indica que os dados não são aleatórios. O entrevistador investiga para determinar se existe um vício na elaboração das perguntas ou na seleção dos entrevistados.

Aleatoriedade em amostras de dados

Neste tópico

Amostras devem ser aleatórias

Determine se uma amostra é aleatória usando um teste de runs

Exemplo de uso de série temporal para determinar que os dados não são aleatórios

Gráfico de série temporal de respostas