In einem Histogramm werden die Stichprobenwerte in eine Reihe von Intervallen unterteilt, und die Häufigkeit der Datenwerte in jedem Intervall wird in Form eines Balkens abgebildet.
Im Histogramm werden die Ergebnisse des Hypothesentests visuell dargestellt. Die Randomisierungsstichproben stellen dar, wie eine Zufallsstichprobe aussehen würde, wenn die Mittelwerte der Grundgesamtheit gleich wären; daher ist das Histogramm um 0 zentriert. Für einen einseitigen Test wird eine Referenzlinie an der Differenz der Mittelwerte der ursprünglichen Stichprobe gezeichnet. Für einen zweiseitigen Test wird eine Referenzlinie an der Differenz der Mittelwerte der ursprünglichen Stichprobe und in der gleichen Entfernung auf der gegenüberliegenden Seite von 0 gezeichnet. Der p-Wert ist der Anteil der Stichprobendifferenzen, die extremer als die Werte auf den Referenzlinien sind. Mit anderen Worten: Der p-Wert ist der Anteil der Stichprobendifferenzen, die genauso extrem wie die ursprüngliche Stichprobe sind, wenn angenommen wird, dass die Nullhypothese wahr ist. Diese Differenzen sind im Histogramm rot gefärbt.
In einem Einzelwertdiagramm werden die Einzelwerte in der Stichprobe gezeigt. Jeder Kreis stellt eine Beobachtung dar. Ein Einzelwertdiagramm ist besonders hilfreich, wenn nur eine kleine Anzahl von Beobachtungen vorliegt und Sie zudem die Auswirkung jeder Beobachtung bewerten müssen.
Minitab zeigt nur dann ein Einzelwertdiagramm an, wenn Sie nur eine Stichprobenwiederholung ziehen. Minitab zeigt sowohl die ursprünglichen Daten als auch die Daten aus der Stichprobenwiederholung an.
μ₁: Mittelwert der Grundgesamtheit von Bewertung, wenn Krankenhaus = A |
---|
µ₂: Mittelwert der Grundgesamtheit von Bewertung, wenn Krankenhaus = B |
Differenz: μ₁ - µ₂ |
Krankenhaus | N | Mittelwert | StdAbw | Varianz | Minimum | Median | Maximum |
---|---|---|---|---|---|---|---|
A | 20 | 80,30 | 8,18 | 66,96 | 62,00 | 79,00 | 98,00 |
B | 20 | 59,30 | 12,43 | 154,54 | 35,00 | 58,50 | 89,00 |
Mittelwert von A – Mittelwert von B = 21,000 |
---|
Nullhypothese | H₀: μ₁ - µ₂ = 0 |
---|---|
Alternativhypothese | H₁: μ₁ - µ₂ ≠ 0 |
Anzahl von Stichprobenwiederholungen | Durchschnitt | StdAbw | p-Wert |
---|---|---|---|
1000 | -0,185 | 4,728 | < 0,002 |
In diesen Ergebnissen besagt die Nullhypothese, dass die Differenz zwischen den Grundgesamtheiten gleich 0 ist. Die Alternativhypothese besagt, dass die Differenz ungleich 0 ist.
Die Anzahl der Stichprobenwiederholungen gibt die Häufigkeit an, mit der Minitab eine Zufallsstichprobe mit Zurücklegen aus dem ursprünglichen Datensatz zieht. Im Allgemeinen empfiehlt sich eine große Anzahl von Stichprobenwiederholungen. Der Stichprobenumfang für jede Stichprobenwiederholung ist gleich dem Stichprobenumfang des ursprünglichen Datensatzes. Die Anzahl der Stichprobenwiederholungen ist gleich der Anzahl der Beobachtungen im Histogramm.
Der Durchschnitt ist die Summe aller Differenzen der Mittelwerte der Randomisierungsstichprobe, dividiert durch die Anzahl der Stichprobenwiederholungen. Minitab zeigt zwei unterschiedliche Werte für die Differenz der Mittelwerte an, die Differenz der beobachteten Stichproben und die Differenz der Bootstrap-Verteilung (Durchschnitt). Beide Werte stellen einen Schätzwert der Differenz zwischen Mittelwerten der Grundgesamtheiten dar und sind im Allgemeinen gleich. Besteht eine große Differenz zwischen diesen beiden Werten, empfiehlt es sich, den Stichprobenumfang der ursprünglichen Stichprobe zu vergrößern.
Die Standardabweichung ist das am häufigsten verwendete Maß für die Streuung bzw. die Streubreite der Daten um den Mittelwert. Die Standardabweichung einer Grundgesamtheit wird häufig mit dem Zeichen σ (Sigma) angegeben, während mit s die Standardabweichung einer Stichprobe dargestellt wird. Eine zufällige oder natürliche Streuung eines Prozesses wird häufig auch als Rauschen bezeichnet. Da die Standardabweichung in der gleichen Einheit wie die Daten angegeben wird, lässt sie sich in der Regel einfacher als die Varianz interpretieren.
Die Standardabweichung der Bootstrap-Stichproben (auch als Bootstrap-Standardfehler bezeichnet) ist ein Schätzwert der Standardabweichung der Stichprobenverteilung der Differenzen der Mittelwerte.
Bestimmen Sie anhand der Standardabweichung, wie stark die Differenzen der Bootstrap-Stichprobe um den Gesamtmittelwert der Differenzen gestreut sind. Ein höherer Wert der Standardabweichung verweist auf eine größere Streubreite der Differenzen. Eine Faustregel für die Normalverteilung besagt, dass etwa 68 % der Werte innerhalb einer Standardabweichung vom Gesamtmittelwert der Differenzen, 95 % der Werte innerhalb zwei Standardabweichungen und 99,7 % der Werte innerhalb drei Standardabweichungen liegen.
Ermitteln Sie mit der Standardabweichung der Bootstrap-Stichproben, wie präzise die Differenzen der Bootstrap-Stichprobe die Differenzen zwischen den Mittelwerten der Grundgesamtheiten schätzen. Ein kleinerer Wert bedeutet einen präziseren Schätzwert für die Differenz der Grundgesamtheiten. Im Allgemeinen ergibt eine größere Standardabweichung einen größeren Bootstrap-Standardfehler und einen weniger präzisen Schätzwert für die Differenz der Grundgesamtheiten. Ein größerer Stichprobenumfang ergibt einen kleineren Bootstrap-Standardfehler und einen präziseren Schätzwert für die Differenz der Grundgesamtheiten.
Der p-Wert ist der Anteil der Stichprobendifferenzen, die genauso extrem wie die ursprüngliche Stichprobe sind, wenn angenommen wird, dass die Nullhypothese wahr ist. Ein kleinerer p-Wert liefert stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.