Was ist ein Test auf gleiche Varianzen?

Verwenden Sie einen Test auf gleiche Varianzen, um zu testen, ob die Varianzen von Grundgesamtheiten oder Faktorstufen gleich sind. Bei vielen statistischen Verfahren, so auch bei der Varianzanalyse (ANOVA) und der Regression, wird angenommen, dass verschiedene Stichproben zwar aus Grundgesamtheiten mit unterschiedlichen Mittelwerten stammen können, aber dennoch die gleiche Varianz aufweisen.

Aufgrund der sehr unterschiedlichen Empfindlichkeit der verschiedenen Verfahren gegenüber ungleichen Varianzen ist auch die Notwendigkeit eines Tests auf gleiche Varianzen sehr unterschiedlich. Rückschlüsse aus ANOVA-Modellen werden von der Ungleichheit der Varianzen z. B. nur wenig berührt, wenn das Modell ausschließlich feste Faktoren enthält und die Stichprobenumfänge gleich oder nahezu gleich sind. Andererseits können ANOVA-Modelle mit zufälligen Effekten und/oder ungleichen Stichprobenumfängen entscheidend beeinflusst werden.

Angenommen, Sie möchten einen ANOVA-Test für die Länge der Zeit durchführen, die sich Anrufer in der Warteschlange befinden, wobei der feste Hauptfaktor das Callcenter ist. Sie verwenden das allgemeine lineare Modell (GLM) für die ANOVA, da die Umfänge der Stichproben ungleich sind. Da sich aufgrund dieser nicht balancierten Bedingung die Empfindlichkeit gegenüber ungleichen Varianzen erhöht, entscheiden Sie sich, die Annahme gleicher Varianzen zu testen. Wenn der resultierende p-Wert größer als angemessene Alpha-Werte ist, können Sie die Nullhypothese gleicher Varianzen nicht zurückweisen. Sie können sich sicher sein, dass die Annahme gleicher Varianzen erfüllt ist.

Die Hypothesen für den Test auf gleiche Varianzen lauten:
  • H0: Alle Varianzen sind gleich.
  • H1: Nicht alle Varianzen sind gleich.

Welcher Test sollte als Grundlage für die Schlussfolgerung herangezogen werden?

Standardmäßig zeigt der Test auf gleiche Varianzen in Minitab Ergebnisse für die Levene-Methode und die Mehrfachvergleichsmethode an. Für die meisten stetigen Verteilungen ergeben beide Methoden eine Wahrscheinlichkeit eines Fehlers 1. Art, die nahe am angegebenen Signifikanzniveau (auch als Alpha oder α bezeichnet) liegt. Die Mehrfachvergleichsmethode weist i. d. R. eine höhere Trennschärfe auf. Wenn der p-Wert für die Mehrfachvergleichsmethode signifikant ist, können Sie mit dem zusammenfassenden Diagramm spezifische Grundgesamtheiten identifizieren, die Standardabweichungen aufweisen, die sich voneinander unterscheiden. Sie sollten Ihren Schlussfolgerungen die Ergebnisse der Mehrfachvergleichsmethode zugrunde legen, es sei denn, folgende Bedingungen sind erfüllt:
  • Jede Stichprobe enthält weniger als 20 Beobachtungen.
  • Die Verteilung von einer oder mehreren Grundgesamtheiten ist extrem schief oder hat stärker besetzte Randbereiche. Im Vergleich zu einer Normalverteilung besitzt eine Verteilung mit stärker besetzten Randbereichen mehr Daten am unteren bzw. oberen Ende.

Wenn kleine Stichproben aus sehr schiefen Verteilungen oder Verteilungen mit stärker besetzten Randbereichen vorliegen, kann die Wahrscheinlichkeit eines Fehlers 1. Art für die Mehrfachvergleichsmethode höher als α sein. Wenn Ihnen unter diesen Umständen die Levene-Methode einen kleineren p-Wert als die Mehrfachvergleichsmethode liefert, sollten Sie Ihre Schlussfolgerungen auf der Levene-Methode basieren. Andernfalls können Sie Ihre Schlussfolgerung auf der Grundlage der Mehrfachvergleichsmethode ziehen, Sie sollten jedoch beachten, dass die Wahrscheinlichkeit eines Fehlers 1. Art wahrscheinlich größer als der α-Wert ist.

F-Test und Bartlett-Test

Anstelle der Mehrfachvergleichsmethode und der Levene-Methode können Sie die Ergebnisse für den Test auch auf der Grundlage der Normalverteilung anfordern. Wenn Sie nur über zwei Gruppen oder Faktorstufen verfügen, führt Minitab den F-Test aus. Bei mindestens drei Gruppen oder Faktorstufen führt Minitab hingegen den Bartlett-Test aus.

Der F-Test und der Bartlett-Test sind nur für normalverteilte Daten genau. Jede Abweichung von einer Normalverteilung kann dazu führen, dass diese Tests zu ungenauen Ergebnissen führen. Wenn die Daten jedoch einer Normalverteilung entsprechen, bieten der F-Test und der Bartlett-Test i. d. R. eine höhere Trennschärfe als die Mehrfachvergleichsmethode oder die Levene-Methode.