In der Ausgabe können Sie mit Hilfe der Nullhypothese und der Alternativhypothese überprüfen, ob Sie den korrekten Wert für das hypothetische Verhältnis eingegeben haben.
Das Signifikanzniveau (als α oder Alpha bezeichnet) ist das maximal akzeptable Risiko, dass die Nullhypothese zurückgewiesen wird, wenn sie tatsächlich wahr ist (Fehler 1. Art). Im Allgemeinen wählen Sie das Signifikanzniveau aus, bevor Sie die Daten analysieren. In Minitab können Sie das Signifikanzniveau auswählen, indem Sie das Konfidenzniveau angeben, da das Signifikanzniveau gleich 1 minus dem Konfidenzniveau ist. Da das Standardkonfidenzniveau in Minitab 0,95 ist, ist das Standardsignifikanzniveau 0,05.
Vergleiche Sie das Signifikanzniveau mit dem p-Wert, um zu entscheiden, ob die Nullhypothese (H0) zurückgewiesen oder nicht zurückgewiesen werden sollte. Wenn der p-Wert kleiner als das Signifikanzniveau ist, sind die Ergebnisse nach gängiger Interpretation statistisch signifikant, und Sie weisen H0 zurück.
Der Stichprobenumfang (N) gibt die Gesamtzahl der Beobachtungen in der Stichprobe an.
Der Stichprobenumfang wirkt sich auf das Konfidenzintervall und auf die Trennschärfe des Tests aus.
Eine größere Stichprobe führt in der Regel zu einem schmaleren Konfidenzintervall. Bei größeren Stichprobenumfängen verfügt der Test außerdem über eine höhere Trennschärfe zum Erkennen einer Differenz. Weitere Informationen finden Sie unter Was ist die Trennschärfe?.
Die Standardabweichung ist das am häufigsten verwendete Maß für die Streuung bzw. die Streubreite der Daten um den Mittelwert. Die Standardabweichung einer Grundgesamtheit wird häufig mit dem Zeichen σ (Sigma) angegeben, während mit s die Standardabweichung einer Stichprobe dargestellt wird. Eine zufällige oder natürliche Streuung eines Prozesses wird häufig auch als Rauschen bezeichnet.
Für die Standardabweichung wird die gleiche Einheit wie für die Daten verwendet.
Die Standardabweichung jeder Stichprobe ist ein Schätzwert der Standardabweichung jeder Grundgesamtheit. Minitab verwendet die Standardabweichung, um das Verhältnis zwischen den Standardabweichungen der Grundgesamtheiten zu schätzen. Sie sollten sich auf dieses Verhältnis konzentrieren.
Die Varianz ist ein Maß der Streuung der Daten um ihren Mittelpunkt. Die Varianz ist gleich dem Quadrat der Standardabweichung.
Die Varianz jeder Stichprobe ist ein Schätzwert der Varianz der betreffenden Grundgesamtheit. Minitab verwendet die Varianzen, um das Verhältnis zwischen den Varianzen der Grundgesamtheiten zu schätzen. Sie sollten sich auf dieses Verhältnis konzentrieren.
Das Verhältnis der Standardabweichungen ist die Standardabweichung der ersten Stichprobe dividiert durch die Standardabweichung der zweiten Stichprobe.
Das geschätzte Verhältnis zwischen den Standardabweichungen der Stichprobendaten ist ein Schätzwert des Verhältnisses zwischen den Standardabweichungen der Grundgesamtheiten.
Da das geschätzte Verhältnis auf Stichprobendaten und nicht auf der vollständigen Grundgesamtheit basiert, ist es unwahrscheinlich, dass das Verhältnis der Stichprobe gleich dem Verhältnis der Grundgesamtheit ist. Verwenden Sie das Konfidenzintervall, um das Verhältnis besser schätzen zu können.
Das Verhältnis der Varianzen ist die Varianz der ersten Stichprobe dividiert durch die Varianz der zweiten Stichprobe.
Das geschätzte Verhältnis zwischen den Varianzen der Stichprobendaten ist ein Schätzwert des Verhältnisses zwischen den Varianzen der Grundgesamtheiten.
Da das geschätzte Verhältnis auf Stichprobendaten und nicht auf der vollständigen Grundgesamtheit basiert, ist es unwahrscheinlich, dass das Verhältnis der Stichprobe gleich dem Verhältnis der Grundgesamtheit ist. Verwenden Sie das Konfidenzintervall, um das Verhältnis besser schätzen zu können.
Das Konfidenzintervall ist ein Bereich wahrscheinlicher Werte für das Verhältnis der Grundgesamtheit. Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie die Stichprobennahme jedoch viele Male wiederholen, enthält ein bestimmter Prozentsatz der resultierenden Konfidenzintervalle oder -grenzen das unbekannte Verhältnis der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle oder -grenzen, die das Verhältnis enthalten, stellt das Konfidenzniveau des Intervalls dar. Ein 95%-Konfidenzniveau gibt beispielsweise an, dass bei einer Entnahme von 100 Zufallsstichproben aus der Grundgesamtheit die Konfidenzintervalle für voraussichtlich ca. 95 der Stichproben das Verhältnis der Grundgesamtheit enthalten.
Eine Obergrenze ist der Wert, der wahrscheinlich größer als das Verhältnis der Grundgesamtheit ist. Eine Untergrenze ist der Wert, der wahrscheinlich kleiner als das Verhältnis der Grundgesamtheit ist.
Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern. Weitere Informationen finden Sie unter Möglichkeiten zum Erhöhen der Genauigkeit des Konfidenzintervalls.
Standardmäßig werden beim Test auf Varianzen bei zwei Stichproben die Ergebnisse für die Levene-Methode und die Ergebnisse für die Bonett-Methode angezeigt. Die Bonett-Methode ist in der Regel zuverlässiger als die Levene-Methode. Bei extrem schiefen Verteilungen und Verteilungen mit stark ausgeprägten Randbereichen ist im Allgemeinen jedoch die Levene-Methode zuverlässiger als die Bonett-Methode. Verwenden Sie den F-Test nur, wenn Sie sich sicher sind, dass die Daten einer Normalverteilung folgen. Selbst geringfügige Abweichungen von der Normalverteilung können die Ergebnisse des F-Tests erheblich beeinflussen. Weitere Informationen finden Sie unter Sollte für Test auf Varianzen, 2 Stichproben die Bonett-Methode oder die Levene-Methode verwendet werden?.
Geschätztes Verhältnis | 95%-KI für Verhältnis unter Verwendung von Bonett | 95%-KI für Verhältnis unter Verwendung von Levene |
---|---|---|
0,658241 | (0,372; 1,215) | (0,378; 1,296) |
In diesen Ergebnissen beträgt der Schätzwert des Verhältnisses zwischen den Standardabweichungen der Grundgesamtheiten für die Bewertungen von zwei Krankenhäusern 0,658. Bei Verwendung der Bonett-Methode können Sie sich zu 95 % sicher sein, dass das Verhältnis zwischen den Standardabweichungen der Grundgesamtheiten für die Krankenhausbewertungen zwischen 0,372 und 1,215 liegt.
Freiheitsgrade (DF) bezeichnen die Menge der von den Daten gelieferten Informationen, die Sie „verbrauchen“ können, um die Werte der unbekannten Parameter der Grundgesamtheit zu schätzen und die Streuung dieser Schätzwerte zu berechnen. Für einen Test auf Varianzen bei zwei Stichproben werden die Freiheitsgrade durch die Anzahl der Beobachtungen in der Stichprobe bestimmt und hängen außerdem von der Methode ab, die Minitab verwendet.
Minitab verwendet die Freiheitsgrade, um die Teststatistik zu berechnen. Die Freiheitsgrade werden durch den Stichprobenumfang bestimmt. Wenn Sie die Stichprobe vergrößern, stehen Ihnen mehr Informationen über die Grundgesamtheit und somit auch mehr Freiheitsgrade zur Verfügung.
Die Teststatistik ist eine Statistik, die Minitab für die Bonett-Methode berechnet, indem das Konfidenzintervall invertiert wird. Die Teststatistik für die Bonett-Methode ist nicht für zusammengefasste Daten oder Daten verfügbar, die nicht balanciert sind.
Sie können die Teststatistik mit kritischen Werten der Chi-Quadrat-Verteilung vergleichen, um zu bestimmen, ob die Nullhypothese zurückzuweisen ist. Es jedoch im Allgemeinen praktischer, hierfür den p-Wert des Tests heranzuziehen. Der p-Wert hat für Tests jeden Umfangs dieselbe Bedeutung, dieselbe Chi-Quadrat-Statistik kann hingegen abhängig vom Stichprobenumfang auf entgegengesetzte Schlussfolgerungen hindeuten.
Die Teststatistik wird verwendet, um den p-Wert zu berechnen.
Bei dem Test wird die F-Statistik der einfachen ANOVA auf die absolute Medianabweichung der Beobachtungen angewendet. Daher entspricht die Anwendung der Levene-Methode der Anwendung einer einfachen ANOVA auf die absolute Medianabweichung der Beobachtungen. Bei Fällen mit zwei Stichproben entspricht diese Methode außerdem der Anwendung des t-Verfahrens bei zwei Stichproben auf die absolute Medianabweichung der Beobachtungen.
Sie können die Teststatistik mit kritischen Werten der F-Verteilung vergleichen, um zu bestimmen, ob die Nullhypothese zurückzuweisen ist. Es jedoch im Allgemeinen praktischer, hierfür den p-Wert des Tests heranzuziehen.
Die Teststatistik wird verwendet, um den p-Wert zu berechnen.
Die Teststatistik ist eine Statistik für F-Tests, die das Verhältnis zwischen den beobachteten Varianzen misst.
Sie können die Teststatistik mit kritischen Werten der F-Verteilung vergleichen, um zu bestimmen, ob die Nullhypothese zurückzuweisen ist. Es jedoch im Allgemeinen praktischer, hierfür den p-Wert des Tests heranzuziehen.
Die Teststatistik wird verwendet, um den p-Wert zu berechnen.
Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Ein kleinerer p-Wert liefert stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.
Verwenden Sie den p-Wert, um zu ermitteln, ob die Differenz zwischen den Standardabweichungen oder Varianzen der Grundgesamtheiten statistisch signifikant ist.
Weitere Informationen finden Sie unter Sollte für Test auf Varianzen, 2 Stichproben die Bonett-Methode oder die Levene-Methode verwendet werden?.
Das zusammenfassende Diagramm zeigt Konfidenzintervalle für das Verhältnis sowie Konfidenzintervalle für die Standardabweichungen oder Varianzen jeder Stichprobe. Das zusammenfassende Diagramm zeigt außerdem Boxplots der Stichprobendaten und p-Werte für die Hypothesentests.
Das Konfidenzintervall ist ein Bereich wahrscheinlicher Werte für das Verhältnis der Grundgesamtheit. Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie die Stichprobennahme jedoch viele Male wiederholen, enthält ein bestimmter Prozentsatz der resultierenden Konfidenzintervalle oder -grenzen das unbekannte Verhältnis der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle oder -grenzen, die das Verhältnis enthalten, stellt das Konfidenzniveau des Intervalls dar. Ein 95%-Konfidenzniveau gibt beispielsweise an, dass bei einer Entnahme von 100 Zufallsstichproben aus der Grundgesamtheit die Konfidenzintervalle für voraussichtlich ca. 95 der Stichproben das Verhältnis der Grundgesamtheit enthalten.
Eine Obergrenze ist der Wert, der wahrscheinlich größer als das Verhältnis der Grundgesamtheit ist. Eine Untergrenze ist der Wert, der wahrscheinlich kleiner als das Verhältnis der Grundgesamtheit ist.
Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern. Weitere Informationen finden Sie unter Möglichkeiten zum Erhöhen der Genauigkeit des Konfidenzintervalls.
Standardmäßig werden beim Test auf Varianzen bei zwei Stichproben die Ergebnisse für die Levene-Methode und die Ergebnisse für die Bonett-Methode angezeigt. Die Bonett-Methode ist in der Regel zuverlässiger als die Levene-Methode. Bei extrem schiefen Verteilungen und Verteilungen mit stark ausgeprägten Randbereichen ist im Allgemeinen jedoch die Levene-Methode zuverlässiger als die Bonett-Methode. Verwenden Sie den F-Test nur, wenn Sie sich sicher sind, dass die Daten einer Normalverteilung folgen. Selbst geringfügige Abweichungen von der Normalverteilung können die Ergebnisse des F-Tests erheblich beeinflussen. Weitere Informationen finden Sie unter Sollte für Test auf Varianzen, 2 Stichproben die Bonett-Methode oder die Levene-Methode verwendet werden?.
Ein Boxplot stellt eine grafische Zusammenfassung der Verteilung jeder Stichprobe dar. Mit dem Boxplot lassen sich die Form, Zentraltendenz und Streuung der Stichproben leicht vergleichen.
Verwenden Sie ein Boxplot, um die Streubreite der Daten zu untersuchen und potenzielle Ausreißer zu identifizieren. Für Boxplots sollte der Stichprobenumfang größer als 20 sein.
Untersuchen Sie die Streubreite der Daten, um zu ermitteln, ob die Daten schief sind. Wenn Daten schief sind, befinden sich die meisten Daten im oberen oder unteren Teil der Grafik. Schiefe ist häufig am einfachsten mit einem Histogramm oder Boxplot zu erkennen.
Daten, die eine sehr starke Schiefe aufweisen, können die Gültigkeit des p-Werts beeinträchtigen, wenn die Stichprobe klein ist (weniger als 20 Werte pro Stichprobe). Wenn Ihre Daten stark schief sind und Ihre Stichprobe klein ist, ziehen Sie in Betracht, die Stichprobe zu vergrößern.
Ausreißer, d. h. Daten, die sich weit entfernt von den anderen Datenwerten befinden, können starke Auswirkungen auf die Ergebnisse Ihrer Analyse haben. Häufig lassen sich Ausreißer am einfachsten in einem Boxplot erkennen.
Versuchen Sie, die Ursache für die Ausreißer zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (so genannte Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse. Weitere Informationen finden Sie unter Identifizieren von Ausreißern.
Ein Einzelwertdiagramm veranschaulicht die einzelnen Werte in jeder Stichprobe. Mit einem Einzelwertdiagramm lassen sich die Stichproben leicht vergleichen. Jeder Kreis stellt eine Beobachtung dar. Ein Einzelwertdiagramm ist besonders dann nützlich, wenn Ihnen relativ wenige Beobachtungen vorliegen und Sie außerdem den Effekt jeder Beobachtung auswerten müssen.
Verwenden Sie ein Einzelwertdiagramm, um die Streubreite der Daten zu untersuchen und potenzielle Ausreißer zu identifizieren. Für Einzelwertdiagramme sollte der Stichprobenumfang größer als 50 sein.
Untersuchen Sie die Streubreite der Daten, um zu ermitteln, ob die Daten schief sind. Wenn Daten schief sind, befinden sich die meisten Daten im oberen oder unteren Teil der Grafik. Schiefe ist häufig am einfachsten mit einem Histogramm oder Boxplot zu erkennen.
Daten, die eine sehr starke Schiefe aufweisen, können die Gültigkeit des p-Werts beeinträchtigen, wenn die Stichprobe klein ist (weniger als 20 Werte pro Stichprobe). Wenn Ihre Daten stark schief sind und Ihre Stichprobe klein ist, ziehen Sie in Betracht, die Stichprobe zu vergrößern.
Ausreißer, d. h. Daten, die sich weit entfernt von den anderen Datenwerten befinden, können starke Auswirkungen auf die Ergebnisse Ihrer Analyse haben. Häufig lassen sich Ausreißer am einfachsten in einem Boxplot erkennen.
Versuchen Sie, die Ursache für die Ausreißer zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (so genannte Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse. Weitere Informationen finden Sie unter Identifizieren von Ausreißern.
In einem Histogramm werden die Stichprobenwerte in eine Reihe von Intervallen unterteilt, und die Häufigkeiten der Datenwerte in jedem Intervall werden in Form eines Balkens abgebildet.
Verwenden Sie ein Histogramm, um die Form und Streubreite der Daten auszuwerten. Für Histogramme sollte der Stichprobenumfang größer als 20 sein.
Untersuchen Sie die Streubreite der Daten, um zu ermitteln, ob die Daten schief sind. Wenn Daten schief sind, befinden sich die meisten Daten im oberen oder unteren Teil der Grafik. Schiefe ist häufig am einfachsten mit einem Histogramm oder Boxplot zu erkennen.
Daten, die eine sehr starke Schiefe aufweisen, können die Gültigkeit des p-Werts beeinträchtigen, wenn die Stichprobe klein ist (weniger als 20 Werte pro Stichprobe). Wenn Ihre Daten stark schief sind und Ihre Stichprobe klein ist, ziehen Sie in Betracht, die Stichprobe zu vergrößern.
Ausreißer, d. h. Daten, die sich weit entfernt von den anderen Datenwerten befinden, können starke Auswirkungen auf die Ergebnisse Ihrer Analyse haben. Häufig lassen sich Ausreißer am einfachsten in einem Boxplot erkennen.
Versuchen Sie, die Ursache für die Ausreißer zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (so genannte Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse. Weitere Informationen finden Sie unter Identifizieren von Ausreißern.