Interpretieren der wichtigsten Ergebnisse für Test auf Varianzen, 2 Stichproben

Führen Sie die folgenden Schritte aus, um einen einen Test auf Varianzen bei zwei Stichproben zu interpretieren. Zu den wichtigsten Ausgaben zählen das Verhältnis, das Konfidenzintervall, der p-Wert sowie mehrere Grafiken.

Schritt 1: Bestimmen eines Konfidenzintervalls für das Verhältnis der Standardabweichungen oder Varianzen

Betrachten Sie zuerst das Verhältnis zwischen den Varianzen oder den Standardabweichungen der Stichproben, und untersuchen Sie anschließend das Konfidenzintervall.

Das geschätzte Verhältnis zwischen den Standardabweichungen und Varianzen der Stichprobendaten ist ein Schätzwert des Verhältnisses zwischen den Standardabweichungen und Varianzen der Grundgesamtheiten. Da das geschätzte Verhältnis auf Stichprobendaten und nicht auf der vollständigen Grundgesamtheit basiert, ist es unwahrscheinlich, dass das Verhältnis der Stichprobe gleich dem Verhältnis der Grundgesamtheit ist. Verwenden Sie das Konfidenzintervall, um das Verhältnis besser schätzen zu können.

Das Konfidenzintervall ist ein Bereich wahrscheinlicher Werte für das Verhältnis zwischen den Varianzen oder Standardabweichungen von zwei Grundgesamtheiten. Ein 95%-Konfidenzniveau gibt beispielsweise an, dass bei einer Entnahme von 100 Zufallsstichproben aus der Grundgesamtheit die Konfidenzintervalle für voraussichtlich ca. 95 der Stichproben das Verhältnis der Grundgesamtheit enthalten. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern. Weitere Informationen finden Sie unter Möglichkeiten zum Erhöhen der Genauigkeit des Konfidenzintervalls.

Standardmäßig werden beim Test auf Varianzen bei zwei Stichproben die Ergebnisse für die Levene-Methode und die Ergebnisse für die Bonett-Methode angezeigt. Die Bonett-Methode ist in der Regel zuverlässiger als die Levene-Methode. Bei extrem schiefen Verteilungen und Verteilungen mit stark ausgeprägten Randbereichen ist im Allgemeinen jedoch die Levene-Methode zuverlässiger als die Bonett-Methode. Verwenden Sie den F-Test nur, wenn Sie sich sicher sind, dass die Daten einer Normalverteilung folgen. Selbst geringfügige Abweichungen von der Normalverteilung können die Ergebnisse des F-Tests erheblich beeinflussen. Weitere Informationen finden Sie unter Sollte für Test auf Varianzen, 2 Stichproben die Bonett-Methode oder die Levene-Methode verwendet werden?.

Im zusammenfassenden Diagramm werden das Konfidenzintervall für das Verhältnis und das Konfidenzintervall für die Standardabweichungen oder die Varianzen dargestellt.

Verhältnis der Standardabweichungen

Geschätztes
Verhältnis
95%-KI für
Verhältnis unter
Verwendung von
Bonett
95%-KI für
Verhältnis unter
Verwendung von
Levene
0,658241(0,372; 1,215)(0,378; 1,296)
Wichtigste Ergebnisse: Geschätztes Verhältnis, KI für Verhältnis, Zusammenfassendes Diagramm

In diesen Ergebnissen beträgt der Schätzwert des Verhältnisses zwischen den Standardabweichungen der Grundgesamtheiten für die Bewertungen von zwei Krankenhäusern 0,658. Bei Verwendung der Bonett-Methode können Sie sich zu 95 % sicher sein, dass das Verhältnis zwischen den Standardabweichungen der Grundgesamtheiten für die Krankenhausbewertungen zwischen 0,372 und 1,215 liegt.

Schritt 2: Bestimmen, ob das Verhältnis statistisch signifikant ist

Um zu ermitteln, ob die Differenz zwischen den Standardabweichungen oder Varianzen der Grundgesamtheiten statistisch signifikant ist, vergleichen Sie den p-Wert mit dem Signifikanzniveau. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 gibt ein Risiko von 5 % an, dass auf eine vorhandene Differenz geschlossen wird, während tatsächlich keine vorhanden ist.
p-Wert ≤ α: Das Verhältnis zwischen den Standardabweichungen oder Varianzen ist statistisch signifikant (H0 verwerfen)
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, weisen Sie die Nullhypothese zurück. Sie können schlussfolgern, dass das Verhältnis zwischen den Standardabweichungen oder Varianzen der Grundgesamtheiten ungleich dem hypothetischen Verhältnis ist. Wenn Sie kein hypothetisches Verhältnis angegeben haben, testet Minitab, ob keine Differenz zwischen den Standardabweichungen oder Varianzen vorliegt Hypothetisches Verhältnis = 1). Bestimmen Sie anhand Ihres Fachwissens, ob die Differenz praktisch signifikant ist. Weitere Informationen finden Sie unter Statistische und praktische Signifikanz.
p-Wert > α: Das Verhältnis zwischen den Standardabweichungen oder Varianzen ist statistisch nicht signifikant (H0 nicht verwerfen)
Wenn der p-Wert größer als das Signifikanzniveau ist, weisen Sie die Nullhypothese nicht zurück. Es liegen nicht genügend Anzeichen für die Schlussfolgerung vor, dass das Verhältnis zwischen den Standardabweichungen oder Varianzen der Grundgesamtheiten statistisch signifikant ist. Vergewissern Sie sich, dass der Test über eine ausreichende Trennschärfe verfügt, um eine praktisch signifikante Differenz zu erkennen. Weitere Informationen finden Sie unter Trennschärfe und Stichprobenumfang für Test auf Varianzen, 2 Stichproben.
Standardmäßig werden beim Test auf Varianzen bei zwei Stichproben die p-Werte für die Levene-Methode und die Bonett-Methode angezeigt. Wenn Sie den Test für die Normalverteilung verwenden, zeigt Minitab den p-Wert für den F-Test an. Wählen Sie anhand der Eigenschaften der Datenverteilung wie folgt einen Test aus:
  • Der Bonett-Test ist für jede stetige Verteilung genau und erfordert keine normalverteilten Daten. Der Bonett-Test ist in der Regel zuverlässiger als der Levene-Test.
  • Der Levene-Test ist bei stetigen Verteilungen ebenfalls genau. Bei extrem schiefen Verteilungen und bei Verteilungen mit stark ausgeprägten Randbereichen ist die Levene-Methode hingegen eher zuverlässiger als die Bonett-Methode.
  • Der F-Test ist nur genau, wenn normalverteilte Daten vorliegen. Selbst geringfügige Abweichung von der Normalverteilung können auch bei großen Stichproben dazu führen, dass der F-Test ungenau ist. Wenn die Daten jedoch der Normalverteilung folgen, weist der F-Test in der Regel eine höhere Trennschärfe als der Bonett- und der Levene-Test auf.

Weitere Informationen finden Sie unter Sollte für Test auf Varianzen, 2 Stichproben die Bonett-Methode oder die Levene-Methode verwendet werden?.

Test

NullhypotheseH₀: σ₁ / σ₂ = 1
AlternativhypotheseH₁: σ₁ / σ₂ ≠ 1
Signifikanzniveauα = 0,05
MethodeTeststatistikDF1DF2p-Wert
Bonett2,091 0,148
Levene1,601380,214
Wichtigstes Ergebnis: p-Wert

In diesen Ergebnissen besagt die Nullhypothese, dass das Verhältnis zwischen den Standardabweichungen der Bewertungen der zwei Krankenhäuser 1 ist. Da beide p-Werte größer als das Signifikanzniveau von 0,05 sind, verwerfen Sie die Nullhypothese nicht und können nicht schlussfolgern, dass die Standardabweichungen der Bewertungen der Krankenhäuser unterschiedlich sind.

Schritt 3: Prüfen der Daten auf Probleme

Probleme mit Ihren Daten, z. B. Schiefe und Ausreißer, können die Ergebnisse beeinträchtigen. Suchen Sie anhand von Grafiken nach Schiefe (durch Untersuchen der Streubreite der einzelnen Stichproben), und ermitteln Sie potenzielle Ausreißer.

Untersuchen Sie die Streubreite der Daten, um zu ermitteln, ob die Daten schief sind.

Wenn die Daten schief sind, liegen die meisten Datenwerte am oberen oder unteren Rand der Grafik. Häufig lässt sich die Schiefe am einfachsten mit einem Histogramm oder einem Boxplot erkennen.

Rechtsschief
Linksschief

Das Histogramm mit rechtsschiefen Daten zeigt Wartezeiten. Die meisten Wartezeiten sind relativ kurz, und nur wenige Wartezeiten sind lang. Das Histogramm mit linksschiefen Daten zeigt Ausfallzeiten. Nur wenige Elemente fallen sofort aus, während viel mehr Elemente zu späteren Zeitpunkten ausfallen.

Stark schiefe Daten können die Gültigkeit des p-Werts beeinträchtigen, wenn die Stichprobe klein ist (eine der Stichproben umfasst weniger als 20 Werte). Wenn die Daten stark schief sind und eine kleine Stichprobe vorliegt, erwägen Sie, den Stichprobenumfang zu vergrößern.

In diesen Histogrammen scheinen die Daten keine starke Schiefe aufzuweisen.

Identifizieren von Ausreißern

Ausreißer, d. h. Datenwerte, die weit entfernt von anderen Datenwerten liegen, können sich stark auf die Ergebnisse der Analyse auswirken. Häufig können Ausreißer am einfachsten in einem Boxplot identifiziert werden.

In einem Boxplot werden Ausreißer mit einem Sternchen (*) gekennzeichnet.

Versuchen Sie, die Ursache für die Ausreißer zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (so genannte Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse. Weitere Informationen finden Sie unter Identifizieren von Ausreißern.

In den Boxplots, die sich im zusammenfassenden Diagramm befinden, weist Krankenhaus B zwei Ausreißer auf.