Interpretieren aller Statistiken und Grafiken für t-Test, 2 Stichproben

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken und Grafiken, die für den t-Test bei zwei Stichproben bereitgestellt werden.

N

Der Stichprobenumfang (N) gibt die Gesamtzahl der Beobachtungen in der Stichprobe an.

Interpretation

Der Stichprobenumfang wirkt sich auf das Konfidenzintervall und auf die Trennschärfe des Tests aus.

Eine größere Stichprobe führt in der Regel zu einem schmaleren Konfidenzintervall. Bei größeren Stichprobenumfängen verfügt der Test außerdem über eine höhere Trennschärfe zum Erkennen einer Differenz. Weitere Informationen finden Sie unter Was ist die Trennschärfe?.

Mittelwert

Der Mittelwert fasst die Stichprobenwerte in einem einzigen Wert zusammen, der das Zentrum der Daten darstellt. Der Mittelwert ist der Durchschnitt der Daten; hierbei handelt es sich um die Summe aller Beobachtungen dividiert durch die Anzahl der Beobachtungen.

Interpretation

Der Mittelwert jeder Stichprobe ist ein Schätzwert des Mittelwerts der Grundgesamtheit, aus der die jeweilige Stichprobe stammt.

StdAbw

Die Standardabweichung ist das am häufigsten verwendete Maß für die Streuung bzw. die Streubreite der Daten um den Mittelwert. Die Standardabweichung einer Grundgesamtheit wird häufig mit dem Zeichen σ (Sigma) angegeben, während mit s die Standardabweichung einer Stichprobe dargestellt wird. Eine zufällige oder natürliche Streuung eines Prozesses wird häufig auch als Rauschen bezeichnet.

Für die Standardabweichung wird die gleiche Einheit wie für die Daten verwendet.

Interpretation

Verwenden Sie die Standardabweichung, um die Streubreite der Daten um den Mittelwert zu ermitteln. Ein höherer Wert der Standardabweichung verweist auf eine größere Streubreite der Daten. Eine Faustregel für die Normalverteilung besagt, dass etwa 68 % der Werte innerhalb einer Standardabweichung vom Mittelwert, 95 % der Werte innerhalb zwei Standardabweichungen und 99,7 % der Werte innerhalb drei Standardabweichungen liegen.

Die Standardabweichung jeder Stichprobe ist ein Schätzwert der Standardabweichung der betreffenden Grundgesamtheit. Die Standardabweichungen werden verwendet, um das Konfidenzintervall und den p-Wert zu berechnen. Ein größerer Wert produziert weniger präzise (breitere) Konfidenzintervalle und Tests mit geringerer Trennschärfe.

Die Standardabweichung kann auch als Richtwert zum Schätzen der Gesamtstreuung eines Prozesses verwendet werden.
Krankenhaus 1
Krankenhaus 2
Zeit bis zur Entlassung in Krankenhäusern

Verwaltungsangestellte zeichnen die Zeit bis zur Entlassung von Patienten auf, die in der Notaufnahme zweier Krankenhäuser behandelt werden. Obwohl die durchschnittliche Zeit bis zur Entlassung in etwa identisch ist (35 Minuten), weichen die Standardabweichungen signifikant voneinander ab. Die Standardabweichung für Krankenhaus 1 beträgt etwa 6. Im Durchschnitt weicht die Zeit bis zur Entlassung eines Patienten um etwa 6 Minuten vom Mittelwert (gestrichelte Linie) ab. Die Standardabweichung für Krankenhaus 2 beträgt etwa 20. Im Durchschnitt weicht die Zeit bis zur Entlassung eines Patienten um ca. 20 Minuten vom Mittelwert (gestrichelte Linie) ab.

SE des Mittelwerts

Der Standardfehler des Mittelwerts (SE des Mittelwerts) schätzt die Streuung zwischen den Stichprobenmittelwerten, die Sie erhalten würden, wenn Sie wiederholt Stichproben aus derselben Grundgesamtheit ziehen. Mit dem Standardfehler des Mittelwerts wird die Streuung zwischen Stichproben geschätzt, während mit der Standardabweichung die Streuung innerhalb einer Stichprobe gemessen wird.

Angenommen bei einer Zufallsstichprobe von 312 Lieferungen beträgt die mittlere Lieferzeit 3,80 Tage, mit einer Standardabweichung von 1,43 Tagen. Diese Werte ergeben einen Standardfehler des Mittelwerts von 0,08 Tagen (1,43 dividiert durch die Quadratwurzel von 312). Würden Sie mehrere zufällig ausgewählte Stichproben gleicher Größe aus derselben Grundgesamtheit ziehen, betrüge die Standardabweichung der verschiedenen Stichprobenmittelwerte etwa 0,08 Tage.

Interpretation

Verwenden Sie den Standardfehler des Mittelwerts, um zu bestimmen, wie präzise der Mittelwert der Stichprobe den Mittelwert der Grundgesamtheit schätzt.

Ein kleinerer Wert des Standardfehlers des Mittelwerts zeigt einen präziseren Schätzwert für den Mittelwert der Grundgesamtheit an. Im Allgemeinen ergibt eine größere Standardabweichung einen größeren Standardfehler des Mittelwerts und einen weniger präzisen Schätzwert für den Mittelwert der Grundgesamtheit. Ein größerer Stichprobenumfang ergibt einen kleineren Standardfehler des Mittelwerts und einen präziseren Schätzwert für den Mittelwert der Grundgesamtheit.

In Minitab wird mit dem Standardfehler des Mittelwerts das Konfidenzintervall berechnet.

Differenz: μ1μ2

Die Differenz ist die unbekannte Differenz zwischen den Mittelwerten der Grundgesamtheit, die geschätzt werden soll. Minitab gibt an, welcher Mittelwert der Grundgesamtheit vom anderen Mittelwert der Grundgesamtheit subtrahiert wird.

Schätzwert für Differenz

Die Differenz ist die Differenz zwischen den Mittelwerten der beiden Stichproben.

Da die Differenz auf Stichprobendaten und nicht auf der vollständigen Grundgesamtheit basiert, ist es unwahrscheinlich, dass die Differenz der Stichprobe gleich der Differenz der Grundgesamtheit ist. Verwenden Sie das Konfidenzintervall für die Differenz, um die Differenz der Grundgesamtheit besser schätzen zu können.

Konfidenzintervall (KI) und Konfidenzgrenzen

Das Konfidenzintervall ist ein Bereich wahrscheinlicher Werte für die Differenz der Grundgesamtheit. Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie die Stichprobennahme jedoch viele Male wiederholen, enthält ein bestimmter Prozentsatz der resultierenden Konfidenzintervalle oder -grenzen die unbekannte Differenz der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle oder -grenzen, die die Differenz enthalten, stellt das Konfidenzniveau des Intervalls dar. Ein 95%-Konfidenzniveau gibt beispielsweise an, dass bei einer Entnahme von 100 Zufallsstichproben aus der Grundgesamtheit die Konfidenzintervalle für voraussichtlich ca. 95 der Stichproben die Differenz der Grundgesamtheit enthalten.

Eine Obergrenze ist der Wert, der wahrscheinlich größer als die Differenz der Grundgesamtheit ist. Eine Untergrenze ist der Wert, der wahrscheinlich kleiner als die Differenz der Grundgesamtheit ist.

Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern. Weitere Informationen finden Sie unter Möglichkeiten zum Erhöhen der Genauigkeit des Konfidenzintervalls.

Schätzwert für Differenz

Differenz95%-KI für
Differenz
21,00(14,22; 27,78)

In diesen Ergebnissen beträgt der Schätzwert des Mittelwerts der Grundgesamtheit für die Differenz zwischen Krankenhausbewertungen 21. Sie können sich zu 95 % sicher sein, dass der Mittelwert der Grundgesamtheit für die Differenz zwischen 14,22 und 27,78 liegt.

Nullhypothese und Alternativhypothese

Für den t-Test der Differenz werden die Nullhypothese und die Alternativhypothese angezeigt. Die Nullhypothese und die Alternativhypothese sind zwei einander ausschließende Aussagen über eine Grundgesamtheit. In einem Hypothesentest werden Stichprobendaten verwendet, um zu bestimmen, ob die Nullhypothese zurückgewiesen werden sollte.
Nullhypothese
Die Nullhypothese besagt, dass ein Parameter einer Grundgesamtheit (z. B. der Mittelwert, die Standardabweichung usw.) gleich einem Hypothesenwert ist. Die Nullhypothese ist oft eine anfängliche Behauptung auf der Grundlage von früheren Analysen oder Fachwissen.
Alternativhypothese
Die Alternativhypothese besagt, dass ein Parameter einer Grundgesamtheit kleiner, größer oder ungleich dem hypothetischen Wert in der Nullhypothese ist. Die Alternativhypothese ist die Hypothese, die Sie als wahr annehmen oder deren Wahrheit Sie nachweisen möchten.

In der Ausgabe können Sie mit Hilfe der Nullhypothese und der Alternativhypothese überprüfen, ob Sie den korrekten Wert für die Testdifferenz eingegeben haben.

t-Wert

Der t-Wert ist der beobachtete Wert der Teststatistik für t-Tests, mit der die Differenz zwischen einer beobachteten Stichprobenstatistik und deren hypothetischem Parameter der Grundgesamtheit in Einheiten des Standardfehlers gemessen wird.

Interpretation

Sie können den t-Wert mit den kritischen Werten der t-Verteilung vergleichen, um zu bestimmen, ob die Nullhypothese zurückzuweisen ist. Es jedoch im Allgemeinen praktischer, hierfür den p-Wert des Tests heranzuziehen.

Um zu bestimmen, ob die Nullhypothese zurückzuweisen ist, vergleichen Sie den t-Wert mit dem kritischen Wert. Wenn Sie Varianz-Gleichheit annehmen, ist der kritische Wert tα/2, n+m–2 für einen beidseitigen Test und tα, n+m–2 für einen einseitigen Test. Können Sie keine Varianz-Gleichheit annehmen, ist der kritische Wert für einen beidseitigen Test tα/2, r und für einen einseitigen Test tα, r, wobei r für die Freiheitsgrade steht. Wenn bei einem beidseitigen Test der Absolutwert des t-Werts größer als der kritische Wert ist, weisen Sie die Nullhypothese zurück. Andernfalls verwerfen Sie die Nullhypothese nicht. Sie können den kritischen Wert in Minitab berechnen oder diesen einer in den meisten Fachbüchern vorhandenen Tabelle für die t-Verteilung entnehmen. Weitere Informationen finden Sie unter Verwenden der inversen kumulativen Verteilungsfunktion (ICDF); klicken Sie dort auf „Verwenden der ICDF zum Berechnen von kritischen Werten“.

Der t-Wert wird verwendet, um den p-Wert zu berechnen.

p-Wert

Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Ein kleinerer p-Wert liefert stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.

Interpretation

Verwenden Sie den p-Wert, um zu ermitteln, ob die Differenz zwischen den Mittelwerten der Grundgesamtheiten statistisch signifikant ist.

Um zu ermitteln, ob die Differenz zwischen den Mittelwerten der Grundgesamtheiten statistisch signifikant ist, vergleichen Sie den p-Wert mit dem Signifikanzniveau. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 gibt ein Risiko von 5 % an, dass auf eine vorhandene Differenz geschlossen wird, während tatsächlich keine vorhanden ist.
p-Wert ≤ α: Die Differenz zwischen den Mittelwerten ist statistisch signifikant (H0 verwerfen)
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, weisen Sie die Nullhypothese zurück. Sie können schlussfolgern, dass die Differenz zwischen den Mittelwerten der Grundgesamtheiten ungleich der hypothetischen Differenz ist. Wenn Sie keine hypothetische Differenz angegeben haben, testet Minitab, ob keine Differenz zwischen den Mittelwerten vorliegt Hypothesendifferenz = 0). Bestimmen Sie anhand Ihres Fachwissens, ob die Differenz praktisch signifikant ist. Weitere Informationen finden Sie unter Statistische und praktische Signifikanz.
p-Wert > α: Die Differenz zwischen den Mittelwerten ist statistisch nicht signifikant (H0 nicht verwerfen)
Wenn der p-Wert größer als das Signifikanzniveau ist, weisen Sie die Nullhypothese nicht zurück. Es liegen nicht genügend Anzeichen für die Schlussfolgerung vor, dass die Differenz zwischen den Mittelwerten der Grundgesamtheiten statistisch signifikant ist. Vergewissern Sie sich, dass der Test über eine ausreichende Trennschärfe verfügt, um eine praktisch signifikante Differenz zu erkennen. Weitere Informationen finden Sie unter Trennschärfe und Stichprobenumfang für t-Test, 2 Stichproben.

DF

Die Freiheitsgrade (DF) bezeichnen die Menge der von den Daten gelieferten Informationen, die zur Verfügung stehen, um die Werte der unbekannten Parameter zu schätzen und die Streuung dieser Schätzwerte zu berechnen. Für einen t-test bei zwei Stichproben werden die Freiheitsgrade durch die Anzahl der Beobachtungen in der Stichprobe bestimmt und hängen außerdem davon ab, ob gleiche Varianzen angenommen werden können.

Interpretation

Minitab verwendet die Freiheitsgrade, um die Teststatistik zu berechnen. Die Freiheitsgrade werden durch den Stichprobenumfang bestimmt. Wenn Sie die Stichprobe vergrößern, stehen Ihnen mehr Informationen über die Grundgesamtheit und somit auch mehr Freiheitsgrade zur Verfügung.

Zusammengefasste StdAbw

Die zusammengefasste Standardabweichung ist ein Schätzwert der gemeinsamen Standardabweichung für beide Stichproben. Die zusammengefasste Standardabweichung ist die Standardabweichung aller Datenpunkte vom jeweiligen Mittelpunkt ihrer Gruppe (nicht vom Gesamtmittelwert). Größere Gruppen haben einen proportional stärkeren Einfluss auf den Gesamtschätzwert der zusammengefassten Standardabweichung.

Interpretation

Die Standardabweichung wird zum Berechnen des Konfidenzintervalls und des p-Werts verwendet.

Ein höherer Wert der Standardabweichung verweist auf eine größere Streubreite der Daten. Ein größerer Wert produziert weniger präzise (breitere) Konfidenzintervalle und Tests mit geringerer Trennschärfe.

Beispiel für eine zusammengefasste Standardabweichung

Angenommen, Ihre Untersuchung umfasst die folgenden zwei Gruppen:
Gruppe Mittelwert Standardabweichung N
1 9,7 2,5 50
2 17,3 6,8 200

Die Standardabweichung der ersten Gruppe (n=50) lautet 2,5. Die zweite Gruppe ist deutlich größer (n=200) und weist eine höhere Standardabweichung auf (6,8). Da für die zusammengefasste Standardabweichung ein gewichteter Durchschnitt verwendet wird, liegt ihr Wert näher an der Standardabweichung der größeren Gruppe. Wenn Sie einen einfachen Durchschnitt verwenden, haben beide Gruppen den gleichen Einfluss.

Einzelwertdiagramm

Ein Einzelwertdiagramm veranschaulicht die einzelnen Werte in jeder Stichprobe. Mit einem Einzelwertdiagramm lassen sich die Stichproben leicht vergleichen. Jeder Kreis stellt eine Beobachtung dar. Ein Einzelwertdiagramm ist besonders dann nützlich, wenn Ihnen relativ wenige Beobachtungen vorliegen und Sie außerdem den Effekt jeder Beobachtung auswerten müssen.

Interpretation

Verwenden Sie ein Einzelwertdiagramm, um die Streubreite der Daten zu untersuchen und potenzielle Ausreißer zu identifizieren. Für Einzelwertdiagramme sollte der Stichprobenumfang größer als 50 sein.

Schiefe Daten

Untersuchen Sie die Streubreite der Daten, um zu ermitteln, ob die Daten schief sind. Wenn Daten schief sind, befinden sich die meisten Daten im oberen oder unteren Teil der Grafik. Schiefe ist häufig am einfachsten mit einem Histogramm oder Boxplot zu erkennen.

Rechtsschief
Linksschief

Das Einzelwertdiagramm mit rechtsschiefen Daten zeigt Wartezeiten. Der Großteil der Wartezeiten ist relativ kurz, nur wenige Wartezeiten sind lang. Das Einzelwertdiagramm mit linksschiefen Daten zeigt Daten zu Ausfallzeiten. Einige Elemente fallen sofort aus, deutlich mehr Elemente fallen später aus.

Daten, die eine sehr starke Schiefe aufweisen, können die Gültigkeit des p-Werts beeinträchtigen, wenn die Stichproben klein sind (weniger als 15 Werte pro Stichprobe). Wenn Ihre Daten stark schief sind und Ihre Stichprobe klein ist, ziehen Sie in Betracht, die Stichprobe zu vergrößern.

Ausreißer

Ausreißer, d. h. Daten, die sich weit entfernt von den anderen Datenwerten befinden, können starke Auswirkungen auf die Ergebnisse Ihrer Analyse haben. Häufig lassen sich Ausreißer am einfachsten in einem Boxplot erkennen.

In einem Einzelwertdiagramm weisen ungewöhnlich hohe oder niedrige Datenwerte auf mögliche Ausreißer hin.

Versuchen Sie, die Ursache für die Ausreißer zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (so genannte Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse. Weitere Informationen finden Sie unter Identifizieren von Ausreißern.

Boxplot

Ein Boxplot stellt eine grafische Zusammenfassung der Verteilung jeder Stichprobe dar. Mit dem Boxplot lassen sich die Form, Zentraltendenz und Streuung der Stichproben leicht vergleichen.

Interpretation

Verwenden Sie ein Boxplot, um die Streubreite der Daten zu untersuchen und potenzielle Ausreißer zu identifizieren. Für Boxplots sollte der Stichprobenumfang größer als 20 sein.

Schiefe Daten

Untersuchen Sie die Streubreite der Daten, um zu ermitteln, ob die Daten schief sind. Wenn Daten schief sind, befinden sich die meisten Daten im oberen oder unteren Teil der Grafik. Schiefe ist häufig am einfachsten mit einem Histogramm oder Boxplot zu erkennen.

Rechtsschief
Linksschief

Das Boxplot mit rechtsschiefen Daten zeigt Wartezeiten. Der Großteil der Wartezeiten ist relativ kurz, nur wenige Wartezeiten sind lang. Das Boxplot mit linksschiefen Daten zeigt Daten zu Ausfallzeiten. Einige Elemente fallen sofort aus, deutlich mehr Elemente fallen später aus.

Daten, die eine sehr starke Schiefe aufweisen, können die Gültigkeit des p-Werts beeinträchtigen, wenn die Stichproben klein sind (weniger als 15 Werte pro Stichprobe). Wenn Ihre Daten stark schief sind und Ihre Stichprobe klein ist, ziehen Sie in Betracht, die Stichprobe zu vergrößern.

Ausreißer

Ausreißer, d. h. Daten, die sich weit entfernt von den anderen Datenwerten befinden, können starke Auswirkungen auf die Ergebnisse Ihrer Analyse haben. Häufig lassen sich Ausreißer am einfachsten in einem Boxplot erkennen.

In einem Boxplot werden Ausreißer mit einem Asterisk (*) gekennzeichnet.

Versuchen Sie, die Ursache für die Ausreißer zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (so genannte Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse. Weitere Informationen finden Sie unter Identifizieren von Ausreißern.