Statistiken und Grafiken der Bootstrap-Stichprobe für Bootstrapping für Mittelwerte, 2 Stichproben

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken und Grafiken der Bootstrap-Stichprobe, die für das Bootstrapping für Mittelwerte bei zwei Stichproben bereitgestellt werden.

Histogramm

In einem Histogramm werden die Stichprobenwerte in eine Reihe von Intervallen unterteilt, und die Häufigkeit der Datenwerte in jedem Intervall wird in Form eines Balkens abgebildet.

Interpretation

Verwenden Sie ein Histogramm, um die Form Ihrer Bootstrap-Verteilung zu untersuchen. Die Bootstrap-Verteilung ist die Verteilung der Differenz der Mittelwerte aus den einzelnen Stichprobenwiederholungen. Die Bootstrap-Verteilung sollte normalverteilt erscheinen. Wenn die Bootstrap-Verteilung nicht normalverteilt ist, sind die Ergebnisse nicht vertrauenswürdig.
50 Stichprobenwiederholungen
1000 Stichprobenwiederholungen

Die Verteilung lässt sich im Allgemeinen leichter mit einer höheren Anzahl von Stichprobenwiederholungen bestimmen. In diesen Daten ist die Verteilung für 50 Stichprobenwiederholungen beispielsweise mehrdeutig. Bei 1000 Stichprobenwiederholungen sieht die Form annähernd normalverteilt aus.

In diesem Histogramm ist die Bootstrap-Verteilung anscheinend normalverteilt.

Einzelwertdiagramm

In einem Einzelwertdiagramm werden die Einzelwerte in der Stichprobe gezeigt. Jeder Kreis stellt eine Beobachtung dar. Ein Einzelwertdiagramm ist besonders hilfreich, wenn nur eine kleine Anzahl von Beobachtungen vorliegt und Sie zudem die Auswirkung jeder Beobachtung bewerten müssen.

Hinweis

Minitab zeigt nur dann ein Einzelwertdiagramm an, wenn Sie nur eine Stichprobenwiederholung ziehen. Minitab zeigt sowohl die ursprünglichen Daten als auch die Daten aus der Stichprobenwiederholung an.

Interpretation

Bei einem großen Stichprobenumfang weist die Bootstrap-Stichprobe im Allgemeinen eine ähnliche Lage und Streubreite wie die ursprüngliche Stichprobe auf. Ein kleiner Stichprobenumfang kann jedoch eine Bootstrap-Stichprobe ergeben, die der ursprünglichen Stichprobe nicht ähnelt. Wenn die Bootstrap-Stichprobe nicht der ursprünglichen Stichprobe ähnelt, empfiehlt es sich, den Stichprobenumfang zu vergrößern.
Stichprobenumfang von 8
Stichprobenumfang von 50

Anzahl von Stichprobenwiederholungen

Die Anzahl der Stichprobenwiederholungen gibt die Häufigkeit an, mit der Minitab eine Zufallsstichprobe mit Zurücklegen aus dem ursprünglichen Datensatz zieht. Im Allgemeinen empfiehlt sich eine große Anzahl von Stichprobenwiederholungen. Der Stichprobenumfang für jede Stichprobenwiederholung ist gleich dem Stichprobenumfang des ursprünglichen Datensatzes. Die Anzahl der Stichprobenwiederholungen ist gleich der Anzahl der Beobachtungen im Histogramm.

Durchschnitt

Der Durchschnitt ist die Summe aller Differenzen der Mittelwerte der Bootstrap-Stichprobe, dividiert durch die Anzahl der Stichprobenwiederholungen.

Interpretation

Minitab zeigt zwei unterschiedliche Werte für die Differenz der Mittelwerte an, die Differenz der beobachteten Stichproben und die Differenz der Bootstrap-Verteilung (Durchschnitt). Beide Werte stellen einen Schätzwert der Differenz zwischen Mittelwerten der Grundgesamtheiten dar und sind im Allgemeinen gleich. Besteht eine große Differenz zwischen diesen beiden Werten, empfiehlt es sich, den Stichprobenumfang der ursprünglichen Stichprobe zu vergrößern.

Da der Durchschnitt auf Stichprobendaten und nicht auf der vollständigen Grundgesamtheit basiert, ist es unwahrscheinlich, dass der Durchschnitt gleich der Differenz zwischen den Mittelwerten der Grundgesamtheiten ist. Verwenden Sie das Konfidenzintervall, um die Differenz zwischen den Mittelwerten der Grundgesamtheiten besser schätzen zu können.

StdAbw (Bootstrap-Stichprobe)

Die Standardabweichung ist das am häufigsten verwendete Maß für die Streuung bzw. die Streubreite der Daten um den Mittelwert. Die Standardabweichung einer Grundgesamtheit wird häufig mit dem Zeichen σ (Sigma) angegeben, während mit s die Standardabweichung einer Stichprobe dargestellt wird. Eine zufällige oder natürliche Streuung eines Prozesses wird häufig auch als Rauschen bezeichnet. Da die Standardabweichung in der gleichen Einheit wie die Daten angegeben wird, lässt sie sich in der Regel einfacher als die Varianz interpretieren.

Die Standardabweichung der Bootstrap-Stichproben (auch als Bootstrap-Standardfehler bezeichnet) ist ein Schätzwert der Standardabweichung der Stichprobenverteilung der Differenzen der Mittelwerte.

Interpretation

Bestimmen Sie anhand der Standardabweichung, wie stark die Differenzen der Bootstrap-Stichprobe um den Gesamtmittelwert der Differenzen gestreut sind. Ein höherer Wert der Standardabweichung verweist auf eine größere Streubreite der Differenzen. Eine Faustregel für die Normalverteilung besagt, dass etwa 68 % der Werte innerhalb einer Standardabweichung vom Gesamtmittelwert der Differenzen, 95 % der Werte innerhalb zwei Standardabweichungen und 99,7 % der Werte innerhalb drei Standardabweichungen liegen.

Ermitteln Sie mit der Standardabweichung der Bootstrap-Stichproben, wie präzise die Differenzen der Bootstrap-Stichprobe die Differenzen zwischen den Mittelwerten der Grundgesamtheiten schätzen. Ein kleinerer Wert bedeutet einen präziseren Schätzwert für die Differenz der Grundgesamtheiten. Im Allgemeinen ergibt eine größere Standardabweichung einen größeren Bootstrap-Standardfehler und einen weniger präzisen Schätzwert für die Differenz der Grundgesamtheiten. Ein größerer Stichprobenumfang ergibt einen kleineren Bootstrap-Standardfehler und einen präziseren Schätzwert für die Differenz der Grundgesamtheiten.

Konfidenzintervall (KI) und Konfidenzgrenzen

Konfidenzintervalle basieren auf der Stichprobenverteilung einer Statistik. Wenn eine Statistik im Hinblick auf den Schätzwert für einen Parameter nicht verzerrt ist, ist ihre Stichprobenverteilung um den wahren Wert des Parameters zentriert. Eine Bootstrapping-Verteilung entspricht annähernd der Stichprobenverteilung der Statistik. Daher liefern die mittleren 95 % der Werte in der Bootstrapping-Verteilung ein 95%-Konfidenzintervall für den Parameter. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz des Schätzwerts für den Parameter der Grundgesamtheit beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind.

Hinweis

Minitab berechnet kein Konfidenzintervall, wenn die Anzahl der Stichprobenwiederholungen zu klein ist, um ein genaues Konfidenzintervall zu erhalten.

Beobachtete Stichproben

KrankenhausNMittelwertStdAbwVarianzMinimumMedianMaximum
A2080,308,1866,9662,0079,0098,00
B2059,3012,43154,5435,0058,5089,00

Differenz der beobachteten Mittelwerte

Mittelwert von A – Mittelwert von B = 21

Bootstrap-Stichproben für Differenz der Mittelwerte

Anzahl von
Stichprobenwiederholungen
DurchschnittStdAbw95%-KI für
Differenz
100020,9603,279(14,400; 27,600)

In diesen Ergebnissen beträgt der Schätzwert für die Differenz der Grundgesamtheit 20,96. Sie können sich zu 95 % sicher sein, dass die Differenz der Grundgesamtheit zwischen 14,4 und 27,6 liegt.