Les échantillons doivent être aléatoires

Un échantillon aléatoire est un sous-ensemble d'une population sélectionné par un procédé qui assure l'équiprobabilité de tous les échantillons d'un effectif donné. Dans le domaine des statistiques, un échantillon aléatoire permet de faire des généralisations ou des déductions sur une population.

Un échantillon doit être collecté de manière aléatoire afin de représenter avec exactitude l'ensemble de la population dont il provient. Vous devez soigneusement planifier la collecte de vos données pour vous assurer que votre échantillon est aléatoire. En outre, le processus ou la population dont proviennent les données doit être stable.

Les échantillons doivent être aléatoires pour éliminer le biais de sélection. On parle de biais de sélection lorsque certains sujets sont plus susceptibles d'être inclus dans l'échantillon que d'autres. Si l'échantillon est biaisé, vous pouvez uniquement faire des déductions concernant les sujets de l'échantillon, mais pas concernant la population entière.

Supposons que vous souhaitiez lancer une nouvelle campagne publicitaire, mais que vous soyez hésitant sur le meilleur média (presse, radio ou télévision) à utiliser pour atteindre vos clients. Comme la réalisation d'une enquête auprès de tous vos clients n'est ni pratique ni économique, vous pouvez réaliser une enquête auprès d'un échantillon aléatoire. Au départ, vous êtes plutôt disposé à réaliser cette enquête auprès des clients qui ont formulé une demande de remboursement par courrier, car il y a plus de chances que ces clients répondent à une enquête. Toutefois, cet échantillon n'est pas représentatif de la population entière car chaque client n'a pas la même chance d'être sélectionné. Cela pourrait vous amener à prendre de mauvaises décisions professionnelles. A la place, vous décidez de procéder à une sélection aléatoire à partir de la liste alphabétique de tous les clients. A partir de ces données, vous pouvez faire des déductions au sujet de votre clientèle afin de déterminer le meilleur média auquel allouer votre budget publicitaire.

Déterminer le caractère aléatoire d'un échantillon à l'aide d'un test des suites

Après avoir collecté les données, vous pouvez vérifier leur caractère aléatoire à l'aide d'un test des suites dans le but de rechercher une tendance dans vos données au cours du temps. Pour effectuer un test dans Minitab, sélectionnez Stat > Tests non paramétriques > Test des suites.

D'autres graphiques vous permettent également de vérifier le caractère aléatoire d'un échantillon.

Exemple d'utilisation d'un diagramme de série chronologique pour déterminer le caractère non aléatoire des données

Supposons qu'un enquêteur choisisse 30 personnes au hasard et leur pose à chacune une question à laquelle il existe quatre réponses possibles. Leurs réponses sont codées à l'aide des chiffres 0, 1, 2 et 3. L'enquêteur crée un diagramme de série chronologique pour vérifier le caractère aléatoire des réponses.

Diagramme de série chronologique des réponses

Le schéma dans les données indique que celles-ci ne sont pas aléatoires. L'enquêteur examine les données dans le but de déterminer si un biais existe dans la formulation des questions ou dans la sélection des sujets.