Wenn Sie Informationen zu einem bestimmten Merkmal der Grundgesamtheit (z. B. dem Mittelwert) ermitteln möchten, entnehmen Sie in der Regel eine Zufallsstichprobe aus dieser Grundgesamtheit, da es nicht möglich ist, die vollständige Grundgesamtheit zu messen. Auf der Grundlage dieser Stichprobe berechnen Sie das entsprechende Merkmal der Stichprobe, mit dem Informationen über das unbekannte Merkmal der Grundgesamtheit zusammengefasst wird. Das betreffende Merkmal der Grundgesamtheit wird als Parameter bezeichnet, das entsprechende Merkmal der Stichprobe als Stichprobenstatistik oder Parameterschätzwert. Da es sich bei der Statistik um eine Zusammenfassung von Informationen über einen Parameter handelt, der aus der Stichprobe gewonnen wurden, hängt der Wert der Statistik von der spezifischen Stichprobe ab, die aus der Grundgesamtheit entnommen wurde. Die Werte variieren zufällig von einer Zufallsstichprobe zur nächsten, und daher stellt die Statistik eine Zufallsmenge (Variable) dar. Die Wahrscheinlichkeitsverteilung dieser Zufallsvariable wird als Stichprobenverteilung bezeichnet. Die Stichprobenverteilung einer (Stichproben-)Statistik ist wichtig, weil sie es uns ermöglicht, auf der Grundlage einer Zufallsstichprobe Rückschlüsse über den entsprechenden Parameter der Grundgesamtheit zu ziehen.
Wenn wir z. B. eine Zufallsstichprobe aus einer normalverteilten Grundgesamtheit entnehmen, ist der Mittelwert der Stichprobe eine Statistik. Der anhand der vorliegenden Stichprobe bestimmte Mittelwert der Stichprobe ist ein Schätzwert des Mittelwerts der Grundgesamtheit. Dieser Schätzwert variiert zufällig, wenn aus derselben normalverteilten Grundgesamtheit eine andere Stichprobe entnommen wird. Die Wahrscheinlichkeitsverteilung, die diese Streuung beschreibt, ist die Stichprobenverteilung des Mittelwerts der Stichprobe. Die Stichprobenverteilung einer Statistik gibt alle möglichen Werte einer Statistik sowie die Häufigkeit an, mit der bestimmte Wertebereiche in der Statistik vorkommen. Wenn die übergeordnete Grundgesamtheit normalverteilt ist, ist die Stichprobenverteilung des Mittelwerts der Stichprobe ebenfalls normalverteilt.
Die folgenden Abschnitte enthalten weitere Informationen über Parameter, Parameterschätzwerte und Stichprobenverteilungen.
Parameter sind deskriptive Maße einer vollständigen Grundgesamtheit, die als Eingaben für eine Dichtefunktion (PDF) verwendet werden können, um Verteilungskurven zu generieren. Parameter werden normalerweise durch griechische Buchstaben angegeben, um diese von Stichprobenstatistiken zu unterscheiden. Der Mittelwert der Grundgesamtheit wird beispielsweise mit dem griechischen Buchstaben Mu (μ) angegeben, die Standardabweichung der Grundgesamtheit mit dem griechischen Buchstaben Sigma (σ). Parameter sind feste Konstanten, d. h., im Gegensatz zu Variablen variieren sie nicht. Ihre Werte sind jedoch i. d. R. unbekannt, da es unmöglich ist, eine komplette Grundgesamtheit zu messen.
Verteilung | Parameter 1 | Parameter 2 | Parameter 3 |
---|---|---|---|
Chi-Quadrat | Freiheitsgrade | ||
Normal | Mittelwert | Standardabweichung | |
Gamma mit 3 Parametern | Form | Skala | Schwellenwert |
Parameter sind deskriptive Maße einer vollständigen Grundgesamtheit. Ihre Werte sind jedoch i. d. R. unbekannt, da es unmöglich ist, eine komplette Grundgesamtheit zu messen. Deshalb können Sie eine Zufallsstichprobe aus einer Grundgesamtheit entnehmen, um Parameterschätzwerte zu erhalten. Ein Ziel von statistischen Analysen ist es, Schätzwerte der Parameter einer Grundgesamtheit zusammen mit dem Fehlerbetrag zu erhalten, der mit diesen Schätzwerten verbunden ist. Diese Schätzwerte werden auch als Stichprobenstatistik bezeichnet.
Ein Beispiel für Parameterschätzwerte: Angenommen, Sie sind für einen Hersteller von Zündkerzen tätig, der ein Problem beim Elektrodenabstand untersucht. Es wäre zu kostspielig, jede einzelne hergestellte Zündkerze zu untersuchen. Sie entnehmen stattdessen eine Zufallsstichprobe von 100 Zündkerzen und messen den Abstand in Millimetern. Der Mittelwert der Stichprobe beträgt 9,2. Dies ist die Punktschätzung des Mittelwerts (μ) einer Grundgesamtheit. Sie erstellen außerdem ein 95%-Konfidenzintervall für μ, das (8,8; 9,6) lautet. Das bedeutet, dass Sie sich zu 95 % sicher sein können, dass der tatsächliche Wert des durchschnittlichen Abstands für alle Zündkerzen zwischen 8,8 und 9,6 liegt.
Kürbis | 1 | 2 | 3 | 4 | 5 | 6 |
Gewicht | 19 | 14 | 15 | 12 | 16 | 17 |
Obwohl die vollständige Grundgesamtheit bekannt ist, untersuchen wir zu Illustrationszwecken alle möglichen Zufallsstichproben der Grundgesamtheit, die jeweils 3 Kürbisse enthalten (20 Zufallsstichproben). Dann berechnen wir für jede Stichprobe den Mittelwert. Die Stichprobenverteilung für den Stichprobenmittelwert wird von allen Stichprobenmittelwerten für jede mögliche Stichprobe von 3 Kürbissen beschrieben, wie in der folgenden Tabelle dargestellt.
Stichprobe | Gewichte | Mittleres Gewicht | Wahrscheinlichkeit |
---|---|---|---|
2, 3, 4 | 14, 15, 12 | 13,7 | 1/20 |
2, 4, 5 | 14, 12, 16 | 14 | 1/20 |
2, 4, 6 | 14, 12, 17 | 14,3 | 2/20 |
3, 4, 5 | 15, 12, 16 | ||
3, 4, 6 | 15, 12, 17 | 14,7 | 1/20 |
1, 2, 4 | 19, 14, 12 | 15 | 3/20 |
2, 3, 5 | 14, 15, 16 | ||
4, 5, 6 | 12, 16, 17 | ||
2, 3, 6 | 14, 15, 17 | 15,3 | 2/20 |
1, 3, 4 | 19, 15, 12 | ||
1, 4, 5 | 19, 12, 16 | 15,7 | 2/20 |
2, 5, 6 | 14, 16, 17 | ||
1, 2, 3 | 19, 14, 15 | 16 | 3/20 |
3, 5, 6 | 15, 16, 17 | ||
1, 4, 6 | 19, 12, 17 | ||
1, 2, 5 | 19, 14, 16 | 16,3 | 1/20 |
1, 2, 6 | 19, 14, 17 | 16,7 | 2/20 |
1, 3, 5 | 19, 15, 16 | ||
1, 3, 6 | 19, 15, 17 | 17 | 1/20 |
1, 5, 6 | 19, 16, 17 | 17,3 | 1/20 |
In der Praxis ist es nicht praktikabel, die Verteilung der Stichprobenverteilung wie in dem obigen Beispiel tabellarisch darzustellen. Selbst im günstigsten Fall, wenn Sie die übergeordnete Grundgesamtheit Ihrer Stichproben kennen, sind Sie möglicherweise nicht in der Lage, die genaue Stichprobenverteilung der zu untersuchenden Stichprobenstatistik zu bestimmen. In einigen Fällen könnten Sie jedoch in der Lage sein, sich der Stichprobenverteilung der Stichprobenstatistik anzunähern. Wenn Sie z. B. eine Stichprobe aus einer normalverteilten Grundgesamtheit entnehmen, weist der Mittelwert der Stichprobe genau die Normalverteilung auf.
Wenn Sie jedoch eine Stichprobe aus einer nicht normalverteilten Grundgesamtheit entnehmen, sind Sie möglicherweise nicht in der Lage, die genaue Verteilung des Mittelwerts der Stichprobe zu bestimmen. Aufgrund des zentralen Grenzwertsatzes ist der Mittelwert der Stichprobe jedoch annähernd normalverteilt, sofern die Stichproben ausreichend groß sind. Wenn die Grundgesamtheit unbekannt ist und Ihre Stichproben groß genug sind, könnten Sie dann beispielsweise die Aussage treffen, dass der Mittelwert der Stichprobe mit einer Sicherheit von ca. 85 % innerhalb einer bestimmten Anzahl von Standardabweichungen vom Mittelwert der Grundgesamtheit liegt.