Die hypergeometrische Verteilung ist eine diskrete Verteilung, die die Anzahl der Ereignisse in einem festen Stichprobenumfang modelliert, wenn Ihnen die Gesamtanzahl der Elemente in der Grundgesamtheit, aus der die Stichprobe stammt, bekannt ist. Für jedes Element in der Stichprobe gibt es zwei mögliche Ergebnisse (entweder Ereignis oder kein Ereignis). Die Stichproben werden ohne Zurücklegen entnommen, was bedeutet, dass alle Elemente in der Stichprobe unterschiedlich sind. Wenn ein Element aus der Grundgesamtheit ausgewählt wurde, kann es nicht erneut ausgewählt werden. Daher erhöht sich für ein Element, das bisher nicht ausgewählt wurde, die Wahrscheinlichkeit der Auswahl bei jedem Versuch.
Verwenden Sie die hypergeometrische Verteilung für Stichproben, die ohne Zurücklegen aus relativ kleinen Grundgesamtheiten entnommen wurden. Mit der hypergeometrischen Verteilung wird z. B. in Fishers exaktem Test die Differenz zwischen zwei Anteilen getestet. Außerdem wird sie bei der Annahmestichprobenprüfung nach Attributen bei der Stichprobenprüfung aus einem isolierten Los endlicher Größe verwendet.
Die hypergeometrische Verteilung wird durch 3 Parameter definiert: Größe der Grundgesamtheit, Ereigniszahl in Grundgesamtheit und Stichprobenumfang.
Angenommen, Ihnen stehen zehn Fahrzeuge für Probefahrten zur Verfügung (N = 10), und fünf davon besitzen Turbomotoren (x = 5). Wenn Sie drei der Fahrzeuge (n = 3) Probe fahren, wie hoch ist die Wahrscheinlichkeit, dass zwei von diesen drei Fahrzeugen Turbomotoren besitzen?
Die Wahrscheinlichkeit, dass Sie zufällig genau zwei Fahrzeuge mit Turbomotor wählen, wenn Sie drei der zehn in Frage kommenden Wagen Probe fahren, beträgt 41,67 %.
Sowohl die hypergeometrische Verteilung als auch die Binomialverteilung beschreiben die Häufigkeit von Ereignissen für eine feste Anzahl von Versuchen. Bei der Binomialverteilung ist die Wahrscheinlichkeit für jeden Versuch gleich. Bei der hypergeometrischen Verteilung ändert jeder Versuch die Wahrscheinlichkeit für jeden nachfolgenden Versuch, da kein Zurücklegen erfolgt.
Verwenden Sie die Binomialverteilung bei Grundgesamtheiten, die so groß sind, dass das Ergebnis eines Versuchs fast keine Auswirkungen auf die Wahrscheinlichkeit hat, mit der das nächste Ergebnis ein Ereignis oder ein Nicht-Ereignis ist. In einer Grundgesamtheit von 100.000 Menschen haben z. B. 53.000 die Blutgruppe 0 positiv. Die Wahrscheinlichkeit, dass die erste zufällig ausgewählte Person in einer Stichprobe die Blutgruppe 0 positiv hat, beträgt 0,530000. Wenn die erste Person in der Stichprobe Blutgruppe 0 positiv hat, dann beträgt die Wahrscheinlichkeit, dass die zweite Person Blutgruppe 0 positiv hat, 0,529995. Der Unterschied zwischen diesen beiden Wahrscheinlichkeiten ist so klein, dass er bei den meisten Anwendungen ignoriert werden kann.
Verwenden Sie die hypergeometrische Verteilung bei Grundgesamtheiten, die so klein sind, dass das Ergebnis eines Versuchs große Auswirkungen auf die Wahrscheinlichkeit hat, mit der das nächste Ergebnis ein Ereignis oder ein Nicht-Ereignis ist. In einer Grundgesamtheit von 10 Menschen haben z. B. 7 die Blutgruppe 0 positiv. Die Wahrscheinlichkeit, dass die erste zufällig ausgewählte Person in der Stichprobe die Blutgruppe 0 positiv hat, beträgt 0,70000. Wenn die erste Person in der Stichprobe Blutgruppe 0 positiv hat, dann beträgt die Wahrscheinlichkeit, dass die zweite Person Blutgruppe 0 positiv hat, 0,66667. Der Unterschied kann sich vergrößern, wenn der Stichprobenumfang zunimmt. Der Unterschied zwischen diesen Wahrscheinlichkeiten ist zu groß, als dass er bei vielen Anwendungen ignoriert werden könnte.