Verwenden von Mehrfachvergleichen zum Beurteilen von Differenzen zwischen Mittelwerten

Was sind Mehrfachvergleiche?

Durch Mehrfachvergleiche zwischen Mittelwerten können Sie untersuchen, welche Mittelwerte Differenzen aufweisen und schätzen, wie groß diese Differenzen sind. Anhand einer Gruppe von Konfidenzintervallen und/oder einer Gruppe von Hypothesentests können Sie die statistische Signifikanz von Differenzen zwischen Mittelwerten beurteilen. Mit den Konfidenzintervallen können Sie neben der statistischen Signifikanz auch die praktische Signifikanz von Differenzen zwischen Mittelwerten beurteilen. Üblicherweise wird die Nullhypothese einer fehlenden Differenz zwischen Mittelwerten nur dann zurückgewiesen, wenn der Wert null im Konfidenzintervall nicht enthalten ist.

Welche Mehrfachvergleichsmethode sollte mit Einfache ANOVA verwendet werden?

Die Auswahl der geeigneten Mehrfachvergleichsmethode hängt vom gewünschten Rückschluss ab. Der vollständig paarweise Ansatz der Tukey-Methode ist ineffizient, wenn die Dunnett-Methode oder die MCB-Methode geeignet ist, da für eine bestimmte simultane Irrtumswahrscheinlichkeit die Tukey-Konfidenzintervalle breiter und die Hypothesentests weniger trennscharf sind. Aus denselben Gründen ist die MCB-Methode gegenüber der Dunnett-Methode vorzuziehen, wenn Faktorstufen ausgeschlossen werden sollen, die nicht die besten sind, und die Stufen bestimmt werden sollen, die die besten oder annähernd die besten sind. Die Entscheidung zwischen der Tukey-Methode und der Fisher-GD-Methode hängt davon ab, ob Sie die simultane oder die individuelle Irrtumswahrscheinlichkeit angeben möchten.

Die Merkmale und Vorteile der einzelnen Methoden sind in der folgenden Tabelle zusammengefasst:
Methode Normalverteilte Daten Festigkeit Vergleich mit einer Kontrolle Paarweiser Vergleich
Tukey Ja Der Test mit der größten Trennschärfe, wenn alle Paare verglichen werden. Nein Ja
Dunnett Ja Der Test mit der größten Trennschärfe, wenn mit einer Kontrolle verglichen wird. Ja Nein
Hsu-MCB-Methode Ja Der Test mit der größten Trennschärfe, wenn die Gruppe mit dem höchsten oder niedrigsten Mittelwert mit den anderen Gruppen verglichen wird. Nein Ja
Games-Howell Ja Wird verwendet, wenn keine Varianz-Gleichheit angenommen wird. Nein Ja
Hinweis

Die einfache ANOVA bietet auch die Fisher-GD-Methode für individuelle Konfidenzintervalle. Die Fisher-Methode ist keine Mehrfachvergleichsmethode, sondern sie unterscheidet mit Hilfe einer individuellen Irrtumswahrscheinlichkeit die individuellen Konfidenzintervalle für die paarweisen Differenzen zwischen den Mittelwerten. Die Fisher-GD-Methode erhöht die simultane Irrtumswahrscheinlichkeit, die in der Ausgabe angezeigt wird.

Welche Mehrfachvergleichsmethode sollte mit Allgemeines lineares Modell anpassen oder Modell mit gemischten Effekten anpassen verwendet werden?

Nachdem Sie Allgemeines lineares Modell anpassen oder Modell mit gemischten Effekten anpassen verwendet haben, nehmen Sie anhand der entsprechenden Analyse Mehrfachvergleiche der Mittelwerte vor:
  • Statistik > Varianzanalyse (ANOVA) > Allgemeines lineares Modell > Vergleiche
  • Statistik > Varianzanalyse (ANOVA) > Modell mit gemischten Effekten > Vergleiche
Beim Ausführen von Mehrfachvergleichen müssen Sie Folgendes auswählen:
  • Paarweise Vergleiche oder Vergleiche mit einer Kontrolle
  • Die Vergleichsmethode

Paarweise Vergleiche oder Vergleiche mit einer Kontrolle

Wählen Sie im Unterdialogfeld Optionen die Option Paarweise aus, wenn Sie nicht über eine Kontrollstufe verfügen und alle Kombinationen von Mittelwerten vergleichen möchten.

Wählen Sie Mit Kontrolle aus, wenn Sie die Mittelwerte der Stufen mit dem Mittelwert einer Kontrollgruppe vergleichen möchten. Wenn diese Methode geeignet ist, ist die Verwendung von paarweisen Vergleichen nicht effizient, da die paarweisen Konfidenzintervalle breiter sind und die Hypothesentests für ein angegebenes simultanes Konfidenzintervall eine geringere Trennschärfe aufweisen.

Die Mehrfachvergleichsmethode

Wählen Sie das Vergleichsverfahren abhängig von den Gruppenmittelwerten, die Sie vergleichen möchten, abhängig vom Typ des Konfidenzniveaus, das Sie angeben möchten, und abhängig davon aus, wie konservativ die Ergebnisse sein sollen. „Konservativ“ bedeutet in diesen Zusammenhang, dass das tatsächliche Konfidenzintervall wahrscheinlich größer als das angezeigte Konfidenzintervall ist.

Außer bei der Fisher-Methode sind in die Mehrfachvergleichsmethoden bereits Schutzmaßnahmen gegen irrtümliche Beurteilungen integriert. Durch den Schutz gegen irrtümliche Beurteilungen bei Mehrfachvergleichen weisen die Intervalle eine größere Breite auf.

Einige Merkmale der Mehrfachvergleichsmethoden sind im Folgenden zusammengefasst:

Vergleichsmethode Eigenschaften Das von Ihnen angegebene Konfidenzniveau
Tukey Nur alle paarweisen Vergleiche, nicht konservativ Simultan
Fisher Kein Schutz gegen irrtümliche Beurteilungen aufgrund von Mehrfachvergleichen Individuell
Dunnett Nur Vergleich mit einer Kontrolle, nicht konservativ Simultan
Bonferroni Konservativste Methode Simultan
Sidak Konservativ, jedoch etwas weniger konservativ als die Bonferroni-Methode Simultan

Was geschieht, wenn der p-Wert aus der ANOVA-Tabelle im Widerspruch zur Ausgabe der Mehrfachvergleiche steht?

Der p-Wert in der ANOVA-Tabelle und in den Ergebnissen der Mehrfachvergleiche basieren auf unterschiedlichen Ansätzen und können gelegentlich zu widersprüchlichen Ergebnissen führen. Beispielsweise ist es möglich, dass der p-Wert aus der ANOVA darauf schließen lässt, dass keine Differenzen zwischen den Mittelwerten vorhanden sind, während die Ausgabe der Mehrfachvergleiche darauf hindeutet, dass einige Mittelwerte unterschiedlich sind. In diesem Fall können Sie im Allgemeinen auf die Ausgabe der Mehrfachvergleiche vertrauen.

Sie benötigen keinen signifikanten p-Wert in der ANOVA-Tabelle, um die Wahrscheinlichkeit zu verringern, dass eine nicht vorhandene Differenz erkannt wird. Dieser Schutz ist bereits im Tukey-Test, Dunnett-Test und MCB-Test (sowie im Fisher-Test, sofern die Mittelwerte gleich sind) integriert.