Statistiken und Grafiken für den Randomisierungstest für Randomisierungstest für Mittelwerte, 2 Stichproben

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken und Grafiken für Randomisierungstests, die für den Randomisierungstest für den Mittelwert bei zwei Stichproben bereitgestellt werden.

Histogramm

In einem Histogramm werden die Stichprobenwerte in eine Reihe von Intervallen unterteilt, und die Häufigkeit der Datenwerte in jedem Intervall wird in Form eines Balkens abgebildet.

Interpretation

Verwenden Sie ein Histogramm, um die Form Ihrer Bootstrap-Verteilung zu untersuchen. Die Bootstrap-Verteilung ist die Verteilung der ausgewählten Statistik aus den einzelnen Stichprobenwiederholungen. Die Bootstrap-Verteilung sollte normalverteilt erscheinen. Wenn die Bootstrap-Verteilung nicht normalverteilt ist, sind die Bootstrap-Ergebnisse nicht vertrauenswürdig.
50 Stichprobenwiederholungen
1000 Stichprobenwiederholungen

Die Verteilung lässt sich im Allgemeinen leichter mit einer höheren Anzahl von Stichprobenwiederholungen bestimmen. In diesen Daten ist die Verteilung für 50 Stichprobenwiederholungen beispielsweise mehrdeutig. Bei 1000 Stichprobenwiederholungen sieht die Form annähernd normalverteilt aus.

Im Histogramm werden die Ergebnisse des Hypothesentests visuell dargestellt. Die Randomisierungsstichproben stellen dar, wie eine Zufallsstichprobe aussehen würde, wenn die Mittelwerte der Grundgesamtheit gleich wären; daher ist das Histogramm um 0 zentriert. Für einen einseitigen Test wird eine Referenzlinie an der Differenz der Mittelwerte der ursprünglichen Stichprobe gezeichnet. Für einen zweiseitigen Test wird eine Referenzlinie an der Differenz der Mittelwerte der ursprünglichen Stichprobe und in der gleichen Entfernung auf der gegenüberliegenden Seite von 0 gezeichnet. Der p-Wert ist der Anteil der Stichprobendifferenzen, die extremer als die Werte auf den Referenzlinien sind. Mit anderen Worten: Der p-Wert ist der Anteil der Stichprobendifferenzen, die genauso extrem wie die ursprüngliche Stichprobe sind, wenn angenommen wird, dass die Nullhypothese wahr ist. Diese Differenzen sind im Histogramm rot gefärbt.

In diesem Histogramm scheint die Bootstrap-Verteilung normalverteilt zu sein. Keine der Stichprobendifferenzen ist größer als 21 oder kleiner als -21.

Einzelwertdiagramm

In einem Einzelwertdiagramm werden die Einzelwerte in der Stichprobe gezeigt. Jeder Kreis stellt eine Beobachtung dar. Ein Einzelwertdiagramm ist besonders hilfreich, wenn nur eine kleine Anzahl von Beobachtungen vorliegt und Sie zudem die Auswirkung jeder Beobachtung bewerten müssen.

Hinweis

Minitab zeigt nur dann ein Einzelwertdiagramm an, wenn Sie nur eine Stichprobenwiederholung ziehen. Minitab zeigt sowohl die ursprünglichen Daten als auch die Daten aus der Stichprobenwiederholung an.

Interpretation

Verwenden Sie das Einzelwertdiagramm, um die ursprünglichen Stichproben mit den Randomisierungsstichproben zu vergleichen. Die Randomisierungsstichproben stellen dar, wie eine Zufallsstichprobe aussehen würde, wenn die Mittelwerte der Grundgesamtheiten gleich wären. Daher ist die Linie, die die Mittelwerte der Randomisierungsstichproben verbindet, tendenziell flach. Vergleichen Sie die Differenz zwischen den Mittelwerten der ursprünglichen Stichproben mit der Differenz zwischen den Mittelwerten der Randomisierungsstichproben. Je steiler die Linie zwischen den beobachteten Stichproben in Bezug auf die Linie zwischen den Randomisierungsstichproben ist, desto mehr Anzeichen gegen das Zutreffen der Nullhypothese sind zu erwarten.
Mittelwerte der Grundgesamtheiten sind gleich
Mittelwert der Grundgesamtheit von Gruppe 1 ist doppelt so groß wie Mittelwert der Grundgesamtheit von Gruppe 2

Nullhypothese und Alternativhypothese

Die Nullhypothese und die Alternativhypothese sind zwei einander ausschließende Aussagen über eine Grundgesamtheit. In einem Hypothesentest werden Stichprobendaten verwendet, um zu bestimmen, ob die Nullhypothese zurückgewiesen werden sollte.
Nullhypothese
Die Nullhypothese besagt, dass ein Parameter einer Grundgesamtheit (z. B. der Mittelwert, die Standardabweichung usw.) gleich einem Hypothesenwert ist. Die Nullhypothese ist oft eine anfängliche Behauptung auf der Grundlage von früheren Analysen oder Fachwissen.
Alternativhypothese
Die Alternativhypothese besagt, dass ein Parameter der Grundgesamtheit kleiner, größer oder abweichend vom Hypothesenwert in der Nullhypothese ist. Die Alternativhypothese ist die Hypothese, die Sie als wahr annehmen oder deren Wahrheit Sie nachweisen möchten.

Methode

μ₁: Mittelwert der Grundgesamtheit von Bewertung, wenn Krankenhaus = A
µ₂: Mittelwert der Grundgesamtheit von Bewertung, wenn Krankenhaus = B
Differenz: μ₁ - µ₂

Beobachtete Stichproben

KrankenhausNMittelwertStdAbwVarianzMinimumMedianMaximum
A2080,308,1866,9662,0079,0098,00
B2059,3012,43154,5435,0058,5089,00

Differenz der beobachteten Mittelwerte

Mittelwert von A – Mittelwert von B = 21,000

Randomisierungstest

NullhypotheseH₀: μ₁ - µ₂ = 0
AlternativhypotheseH₁: μ₁ - µ₂ ≠ 0
Anzahl von
Stichprobenwiederholungen
DurchschnittStdAbwp-Wert
1000-0,1854,728< 0,002

In diesen Ergebnissen besagt die Nullhypothese, dass die Differenz zwischen den Grundgesamtheiten gleich 0 ist. Die Alternativhypothese besagt, dass die Differenz ungleich 0 ist.

Anzahl von Stichprobenwiederholungen

Die Anzahl der Stichprobenwiederholungen gibt die Häufigkeit an, mit der Minitab eine Zufallsstichprobe mit Zurücklegen aus dem ursprünglichen Datensatz zieht. Im Allgemeinen empfiehlt sich eine große Anzahl von Stichprobenwiederholungen. Der Stichprobenumfang für jede Stichprobenwiederholung ist gleich dem Stichprobenumfang des ursprünglichen Datensatzes. Die Anzahl der Stichprobenwiederholungen ist gleich der Anzahl der Beobachtungen im Histogramm.

Durchschnitt

Der Durchschnitt ist die Summe aller Differenzen der Mittelwerte der Randomisierungsstichprobe, dividiert durch die Anzahl der Stichprobenwiederholungen. Minitab zeigt zwei unterschiedliche Werte für die Differenz der Mittelwerte an, die Differenz der beobachteten Stichproben und die Differenz der Bootstrap-Verteilung (Durchschnitt). Beide Werte stellen einen Schätzwert der Differenz zwischen Mittelwerten der Grundgesamtheiten dar und sind im Allgemeinen gleich. Besteht eine große Differenz zwischen diesen beiden Werten, empfiehlt es sich, den Stichprobenumfang der ursprünglichen Stichprobe zu vergrößern.

StdAbw (Bootstrap-Stichprobe)

Die Standardabweichung ist das am häufigsten verwendete Maß für die Streuung bzw. die Streubreite der Daten um den Mittelwert. Die Standardabweichung einer Grundgesamtheit wird häufig mit dem Zeichen σ (Sigma) angegeben, während mit s die Standardabweichung einer Stichprobe dargestellt wird. Eine zufällige oder natürliche Streuung eines Prozesses wird häufig auch als Rauschen bezeichnet. Da die Standardabweichung in der gleichen Einheit wie die Daten angegeben wird, lässt sie sich in der Regel einfacher als die Varianz interpretieren.

Die Standardabweichung der Bootstrap-Stichproben (auch als Bootstrap-Standardfehler bezeichnet) ist ein Schätzwert der Standardabweichung der Stichprobenverteilung der Differenzen der Mittelwerte.

Interpretation

Bestimmen Sie anhand der Standardabweichung, wie stark die Differenzen der Bootstrap-Stichprobe um den Gesamtmittelwert der Differenzen gestreut sind. Ein höherer Wert der Standardabweichung verweist auf eine größere Streubreite der Differenzen. Eine Faustregel für die Normalverteilung besagt, dass etwa 68 % der Werte innerhalb einer Standardabweichung vom Gesamtmittelwert der Differenzen, 95 % der Werte innerhalb zwei Standardabweichungen und 99,7 % der Werte innerhalb drei Standardabweichungen liegen.

Ermitteln Sie mit der Standardabweichung der Bootstrap-Stichproben, wie präzise die Differenzen der Bootstrap-Stichprobe die Differenzen zwischen den Mittelwerten der Grundgesamtheiten schätzen. Ein kleinerer Wert bedeutet einen präziseren Schätzwert für die Differenz der Grundgesamtheiten. Im Allgemeinen ergibt eine größere Standardabweichung einen größeren Bootstrap-Standardfehler und einen weniger präzisen Schätzwert für die Differenz der Grundgesamtheiten. Ein größerer Stichprobenumfang ergibt einen kleineren Bootstrap-Standardfehler und einen präziseren Schätzwert für die Differenz der Grundgesamtheiten.

p-Wert

Der p-Wert ist der Anteil der Stichprobendifferenzen, die genauso extrem wie die ursprüngliche Stichprobe sind, wenn angenommen wird, dass die Nullhypothese wahr ist. Ein kleinerer p-Wert liefert stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.

Interpretation

Verwenden Sie den p-Wert, um zu ermitteln, ob die Differenz zwischen den Mittelwerten der Grundgesamtheiten statistisch signifikant ist. Um zu ermitteln, ob die Differenz zwischen den Mittelwerten der Grundgesamtheiten statistisch signifikant ist, vergleichen Sie den p-Wert mit dem Signifikanzniveau. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 gibt ein Risiko von 5 % an, dass auf eine vorhandene Differenz geschlossen wird, während tatsächlich keine vorhanden ist.
p-Wert ≤ α: Die Differenz zwischen den Mittelwerten ist statistisch signifikant (H0 verwerfen)
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, weisen Sie die Nullhypothese zurück. Sie können schlussfolgern, dass die Differenz zwischen den Mittelwerten der Grundgesamtheiten statistisch signifikant ist. Um ein Konfidenzintervall zu berechnen und zu ermitteln, ob die Differenz praktisch signifikant ist, verwenden Sie das Verfahren Bootstrapping für Mittelwerte, 2 Stichproben. Weitere Informationen finden Sie unter Statistische und praktische Signifikanz.
p-Wert > α: Die Differenz zwischen den Mittelwerten ist statistisch nicht signifikant (H0 nicht verwerfen)
Wenn der p-Wert größer als das Signifikanzniveau ist, weisen Sie die Nullhypothese nicht zurück. Es liegen nicht genügend Anzeichen für die Schlussfolgerung vor, dass die Differenz zwischen den Mittelwerten der Grundgesamtheiten statistisch signifikant ist.