La loi hypergéométrique est une loi de probabilité discrète qui modélise le nombre d'événements dans un effectif d'échantillon fixe lorsque vous connaissez le nombre total d'éléments dans la population d'où provient l'échantillon. Il existe deux résultats possibles pour chaque élément de l'échantillon (un événement ou un non-événement). Les échantillons sont sans remplacement, chaque élément de l'échantillon est donc différent. Lorsqu'un élément de la population est choisi, il ne peut plus être de nouveau choisi. La probabilité qu'un élément donné soit sélectionné augmente par conséquent à chaque essai à partir du moment où il n'a pas encore été sélectionné.
Utilisez la loi hypergéométrique pour les échantillons prélevés auprès de populations relativement restreintes, sans remise. Cette loi est par exemple utilisée dans un test exact de Fisher pour tester la différence entre deux proportions et dans le plan de contrôle par attributs lors d'un échantillonnage dans un lot isolé de taille finie.
La loi hypergéométrique est caractérisée par 3 paramètres : l'effectif de la population, le nombre d'événements dans la population et l'effectif d'échantillon.
Supposez que vous puissiez effectuer un test de conduite sur dix voitures (N = 10) et que cinq de ces voitures aient un moteur turbo (x = 5). Si vous testez trois de ces voitures (n = 3), quelle est la probabilité pour que deux des trois voitures testées possèdent des moteurs turbo ?
La probabilité que vous choisissiez au hasard exactement deux voitures avec un moteur turbo lorsque vous testez sur route trois des dix voitures est de 41,67 %.
La loi hypergéométrique et la loi binomiale indiquent toutes les deux le nombre d'occurrences d'un événement au cours d'un nombre fixe d'essais. Pour la loi binomiale, la probabilité est la même pour chaque essai. Dans le cadre de la loi hypergéométrique, chaque essai change la probabilité de chacun des essais suivants du fait de l'absence de remise.
Utilisez la loi binomiale avec des populations très grandes afin que le résultat d'un essai n'ait presque aucun effet sur la probabilité selon laquelle le résultat suivant sera un événement ou un non-événement. Par exemple, dans une population de 100 000 personnes, 53 000 sont du groupe sanguin O+. La probabilité que la première personne choisie au hasard dans un échantillon soit du groupe sanguin O+ est de 0,530000. Si la première personne d'un échantillon est O+, la probabilité que la deuxième le soit aussi est de 0,529995. La différence entre ces probabilités est assez faible pour être ignorée dans la plupart des domaines d'utilisation.
Utilisez la loi hypergéométrique avec des populations très faibles afin que le résultat d'un essai ait un effet important sur la probabilité selon laquelle le résultat suivant sera un événement ou un non-événement. Par exemple, dans une population de 10 personnes, 7 sont du groupe sanguin O+. La probabilité que la première personne choisie au hasard dans un échantillon soit du groupe sanguin O+ est de 0,70000. Si la première personne d'un échantillon est O+, la probabilité que la deuxième le soit aussi est de 0,66667. La différence peut augmenter avec l'effectif d'échantillon. La différence entre ces probabilités est trop importante pour être ignorée pour la plupart des domaines d'utilisation.