Interpretieren aller Statistiken und Grafiken für Trennschärfe und Stichprobenumfang für Äquivalenztest, 2 Stichproben

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken und Grafiken, die mit „Trennschärfe und Stichprobenumfang für Äquivalenztest, 2 Stichproben“ bereitgestellt werden.

Trennschärfe für Differenz

In der ersten Zeile der Ausgabe wird angegeben, wie die Hypothesen für den Äquivalenztest ausgedrückt wurden.

„Trennschärfe für Differenz“ gibt an, dass die Hypothesen als Differenz zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit (Testmittelwert – Referenzmittelwert) ausgedrückt wurden.

Trennschärfe für Verhältnis

In der ersten Zeile der Ausgabe wird angegeben, wie die Hypothesen für den Äquivalenztest ausgedrückt wurden.

„Trennschärfe für Verhältnis“ gibt an, dass die Hypothesen als Verhältnis zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit durch Log-Transformation (Testmittelwert / Referenzmittelwert) ausgedrückt wurden.

Nullhypothese und Alternativhypothese

Die Nullhypothese und die Alternativhypothese sind einander ausschließende Aussagen über eine Grundgesamtheit. In einem Äquivalenztest wird anhand von Stichprobendaten bestimmt, ob die Nullhypothese zurückgewiesen werden muss.
Nullhypothese
Minitab testet je nach ausgewählter Alternativhypothese eine oder beide der folgenden Nullhypothesen:
  • Die Differenz (oder das Verhältnis) zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist größer als die oder gleich der oberen Äquivalenzgrenze.
  • Die Differenz (oder das Verhältnis) zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist kleiner als die oder gleich der unteren Äquivalenzgrenze.
Alternativhypothese
Mit der Alternativhypothese werden eine bzw. beide der folgenden Aussagen getroffen:
  • Die Differenz (oder das Verhältnis) zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist kleiner als die obere Äquivalenzgrenze.
  • Die Differenz (oder das Verhältnis) zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist größer als die untere Äquivalenzgrenze.

Interpretation

Verwenden Sie die Nullhypothese und die Alternativhypothese, um die Richtigkeit der Äquivalenzkriterien zu bestätigen und um zu prüfen, ob Sie die geeignete zu testende Alternativhypothese ausgewählt haben.

Methode

Trennschärfe für Differenz: Testmittelwert - Referenzmittelwert
Nullhypothese:Differenz ≤ -1 oder Differenz ≥ 1
Alternativhypothese:-1 < Differenz < 1
α-Niveau:0,05
Angenommene Standardabweichung:0,41

In diesen Ergebnissen testet Minitab zwei Nullhypothesen:
  • Die Differenz zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist kleiner oder gleich der unteren Äquivalenzgrenze von −1.
  • Die Differenz zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist größer oder gleich der oberen Äquivalenzgrenze von 1.
Die Alternativhypothese besagt, dass die Differenz zwischen der unteren und der oberen Äquivalenzgrenze liegt (d. h., dass der Mittelwert der Testgrundgesamtheit äquivalent zum Mittelwert der Referenzgrundgesamtheit ist).

α (Alpha)

Das Signifikanzniveau (als Alpha oder α bezeichnet) ist das maximal akzeptable Risiko, dass die Nullhypothese zurückgewiesen wird, wenn sie tatsächlich wahr ist (Fehler 1. Art). Wenn Sie beispielsweise einen Äquivalenztest mit den Standardhypothesen durchführen, gibt ein α von 0,05 ein Risiko von 5 % an, dass auf eine Äquivalenz geschlossen wird, wenn die Differenz zwischen dem Testmittelwert und dem Referenzmittelwert tatsächlich nicht innerhalb der Äquivalenzgrenzen liegt.

Das α-Niveau für einen Äquivalenztest bestimmt auch das Konfidenzniveau für das Konfidenzintervall. In der Standardeinstellung beträgt das Konfidenzniveau (1 – α) x 100 %. Wenn Sie die alternative Berechnungsmethode für das Konfidenzintervall anwenden, ist das Konfidenzniveau (1 – 2α) x 100 %.

Interpretation

Verwenden Sie das Signifikanzniveau, um den Trennschärfewert des Tests zu minimieren, wenn die Nullhypothese (H0) wahr ist. Bei höheren Signifikanzniveaus ist der Test trennschärfer, gleichzeitig steigt jedoch die Wahrscheinlichkeit, dass ein Fehler 1. Art auftritt, beim dem die Nullhypothese zurückgewiesen wird, wenn diese tatsächlich wahr ist.

Angenommene Standardabweichung

Die Standardabweichung ist das am häufigsten verwendete Maß für die Streuung bzw. die Streubreite der Daten um den Mittelwert. Eine zufällige oder natürliche Streuung eines Prozesses wird häufig auch als Rauschen bezeichnet.

Interpretation

Die angenommene Standardabweichung ist ein Planschätzwert der Standardabweichung der Grundgesamtheit, die Sie für die Analyse der Trennschärfe eingeben. Minitab verwendet die angenommene Standardabweichung, um die Trennschärfe des Tests zu berechnen. Höhere Werte der Standardabweichung verweisen auf eine stärkere Streuung der Daten, was die statistische Trennschärfe des Tests reduziert.

Differenz

Dieser Wert stellt die Differenz zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit dar.

Hinweis

Die Definitionen und Anleitungen zur Interpretation in diesem Artikel beziehen sich auf einen Standardtest der Äquivalenz, bei dem die Standard-Alternativhypothese (Untergrenze < Testmittelwert - Referenzmittelwert < Obergrenze) verwendet wird.

Interpretation

Wenn Sie den Stichprobenumfang und die Trennschärfe für den Test eingeben, berechnet Minitab die Differenz, die mit dem Test bei den angegebenen Werten für Trennschärfe und Stichprobenumfang erkannt werden kann. Bei größeren Stichprobenumfängen kann die Differenz näher an den Äquivalenzgrenzen liegen.

Wenn Sie die Beziehung zwischen dem Stichprobenumfang und der Differenz bei einer bestimmten Trennschärfe eingehender untersuchen möchten, verwenden Sie die Trennschärfekurve.

Methode

Trennschärfe für Differenz: Testmittelwert - Referenzmittelwert
Nullhypothese:Differenz ≤ -1 oder Differenz ≥ 1
Alternativhypothese:-1 < Differenz < 1
α-Niveau:0,05
Angenommene Standardabweichung:0,41

Ergebnisse

StichprobenumfangTrennschärfeDifferenz
80,9-0,368540
80,90,368540
120,9-0,494285
120,90,494285
200,9-0,613616
200,90,613616
Der Stichprobenumfang gilt für jede Gruppe.

Diese Ergebnisse zeigen, dass mit zunehmendem Stichprobenumfang die Größe der Differenz zunimmt, die vom Test bei einer bestimmten Trennschärfe erkannt werden kann:

  • Bei 8 Beobachtungen in jeder Gruppe beträgt die Trennschärfe des Tests mindestens 0,9, wenn die Differenz zwischen ungefähr −0,37 und 0,37 liegt.
  • Bei 12 Beobachtungen in jeder Gruppe beträgt die Trennschärfe des Tests mindestens 0,9, wenn die Differenz zwischen ungefähr −0,49 und 0,49 liegt.
  • Bei 20 Beobachtungen in jeder Gruppe beträgt die Trennschärfe des Tests mindestens 0,9, wenn die Differenz zwischen ungefähr −0,61 und 0,61 liegt.

Verhältnis

Dieser Wert stellt das Verhältnis zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit dar. Zum Durchführen von Trennschärfeberechnungen für ein Verhältnis müssen Sie eine Hypothese zu Testmittelwert / Referenzmittelwert (Verhältnis, durch Log-Transformation) auswählen.

Hinweis

Die Definitionen und Anleitungen zur Interpretation in diesem Artikel beziehen sich auf einen Äquivalenztest, bei dem die Standard-Alternativhypothese für das Verhältnis (Untergrenze < Testmittelwert / Referenzmittelwert < Obergrenze) verwendet wird.

Interpretation

Wenn Sie den Stichprobenumfang und die Trennschärfe für den Test eingeben, berechnet Minitab das minimale und das maximale Verhältnis, das mit dem Test bei den angegebenen Werten für Trennschärfe und Stichprobenumfang erkannt werden kann. Bei größeren Stichprobenumfängen kann das Verhältnis näher an den Äquivalenzgrenzen liegen.

Wenn Sie die Beziehung zwischen dem Stichprobenumfang und den Verhältnissen bei einer bestimmten Trennschärfe eingehender untersuchen möchten, verwenden Sie die Trennschärfekurve.

Methode

Trennschärfe für Verhältnis:Testmittelwert / Referenzmittelwert
Nullhypothese:Verhältnis ≤ 0,9 oder Verhältnis ≥ 1,1
Alternativhypothese:0,9 < Verhältnis < 1,1
α-Niveau:0,05
Angenommener Variationskoeffizient:0,09

Ergebnisse

StichprobenumfangTrennschärfeVerhältnis
100,9*
250,90,97060
250,91,01999
350,90,95897
350,91,03235
Der Stichprobenumfang gilt für jede Gruppe.

Diese Ergebnisse zeigen, dass mit zunehmendem Stichprobenumfang der Bereich der Verhältnisse zunimmt, die bei einer bestimmten Trennschärfe erkannt werden können:

  • Bei 10 Beobachtungen in jeder Gruppe kann mit dem Test bei keinem Verhältnis eine Trennschärfe von 0,9 erreicht werden.
  • Bei 25 Beobachtungen in jeder Gruppe beträgt die Trennschärfe des Tests mindestens 0,9, wenn das Verhältnis zwischen ungefähr 0,97 und 1,02 liegt.
  • Bei 35 Beobachtungen in jeder Gruppe beträgt die Trennschärfe des Tests mindestens 0,9, wenn das Verhältnis zwischen ungefähr 0,96 und 1,03 liegt.

Stichprobenumfang

Der Stichprobenumfang gibt die Gesamtzahl der Beobachtungen in der Stichprobe an. Für einen Äquivalenztest bei zwei Stichproben bezieht sich der Stichprobenumfang auf die Anzahl der Beobachtungen in jeder der beiden Gruppen.

Interpretation

Anhand des Stichprobenumfangs können Sie schätzen, wie viele Beobachtungen Sie benötigen, um bei einer angegebenen Differenz eine bestimmte Trennschärfe für den Äquivalenztest zu erreichen.

Wenn Sie eine Differenz (oder ein Verhältnis) und einen Trennschärfewert für den Test eingeben, berechnet Minitab, wie groß die Stichprobe sein muss. Da der Stichprobenumfang als ganze Zahl angegeben wird, kann die tatsächliche Trennschärfe des Tests etwas höher als der von Ihnen angegebene Trennschärfewert ausfallen.

Wenn Sie den Stichprobenumfang vergrößern, nimmt auch die Trennschärfe des Tests zu. Es empfiehlt sich, dass eine ausreichende Anzahl von Beobachtungen in der Stichprobe vorliegen, um eine angemessene Trennschärfe zu erzielen. Der Stichprobenumfang sollte jedoch nicht so groß sein, dass Zeit und Geld bei der Stichprobennahme vergeudet oder irrelevante Differenzen als statistisch signifikant erkannt werden.

Wenn Sie die Beziehung zwischen dem Stichprobenumfang und der Differenz (oder dem Verhältnis), die bzw. das mit dem Test bei einer bestimmten Trennschärfe erkannt werden kann, eingehender untersuchen möchten, verwenden Sie die Trennschärfekurve.

Methode

Trennschärfe für Differenz: Testmittelwert - Referenzmittelwert
Nullhypothese:Differenz ≤ -1 oder Differenz ≥ 1
Alternativhypothese:-1 < Differenz < 1
α-Niveau:0,05
Angenommene Standardabweichung:0,41

Ergebnisse

DifferenzStichprobenumfangSoll-TrennschärfeIst-Trennschärfe
0,5130,90,915407
0,7330,90,902461
0,92890,90,900360
Der Stichprobenumfang gilt für jede Gruppe.

Diese Ergebnisse zeigen, dass Sie einen größeren Stichprobenumfang benötigen, um eine bestimmte Trennschärfe zu erreichen, wenn die Differenz zunimmt und sich an die Äquivalenzgrenze annähert. Bei einer Differenz von 0,5 benötigen Sie 13 Beobachtungen in jeder Gruppe, um eine Trennschärfe von 0,9 zu erreichen. Mit einem Stichprobenumfang von 13 erreichen Sie eine Trennschärfe von ungefähr 0,92. Bei einer Differenz von 0,9 benötigen Sie in jeder Gruppe mindestens 289 Beobachtungen, um eine Trennschärfe von 0,9 zu erreichen.

Trennschärfe

Die Trennschärfe eines Äquivalenztests ist die Wahrscheinlichkeit, mit der der Test nachweist, dass die Differenz (oder das Verhältnis) innerhalb der Äquivalenzgrenzen liegt, wenn dies tatsächlich der Fall ist. Die Trennschärfe eines Äquivalenztests wird vom Stichprobenumfang, der Differenz, den Äquivalenzgrenzen, der Streuung der Daten und dem Signifikanzniveau des Tests beeinflusst.

Weitere Informationen finden Sie unter Trennschärfe für Äquivalenztests.

Interpretation

Wenn Sie einen Stichprobenumfang und eine Differenz (oder ein Verhältnis) eingeben, berechnet Minitab die Trennschärfe des Tests. Ein Trennschärfewert von mindestens 0,9 wird im Allgemeinen als geeignet angesehen. Eine Trennschärfe von 0,9 bedeutet, dass mit dem Test mit einer Wahrscheinlichkeit von 90 % Äquivalenz nachgewiesen wird, sofern die Differenz (oder das Verhältnis) zwischen den Mittelwerten der Grundgesamtheiten tatsächlich innerhalb der Äquivalenzgrenzen liegt. Wenn ein Äquivalenztest eine zu geringe Trennschärfe aufweist, können Sie die Äquivalenz möglicherweise nicht nachweisen, selbst wenn der Test-Mittelwert und der Referenzmittelwert äquivalent sind.

Wenn Sie eine Differenz (oder ein Verhältnis) und einen Trennschärfewert für den Test eingeben, berechnet Minitab, wie groß die Stichprobe sein muss. Minitab berechnet außerdem die tatsächliche Trennschärfe des Tests für diesen Stichprobenumfang. Da der Stichprobenumfang als ganze Zahl angegeben wird, kann die tatsächliche Trennschärfe des Tests etwas höher als der von Ihnen angegebene Trennschärfewert ausfallen.

In der Regel weist der Test bei einem kleineren Stichprobenumfang oder einer Differenz (bzw. einem Verhältnis), die (bzw. das) näher an einer Äquivalenzgrenze liegt, eine geringere Trennschärfe zum Nachweisen einer Äquivalenz auf.

Methode

Trennschärfe für Differenz: Testmittelwert - Referenzmittelwert
Nullhypothese:Differenz ≤ -1 oder Differenz ≥ 1
Alternativhypothese:-1 < Differenz < 1
α-Niveau:0,05
Angenommene Standardabweichung:0,41

Ergebnisse

DifferenzStichprobenumfangTrennschärfe
0,580,749766
0,5150,946583
0,5250,995405
0,880,236964
0,8150,366456
0,8250,522098
Der Stichprobenumfang gilt für jede Gruppe.

In diesen Ergebnissen ergibt sich aus dem Stichprobenumfang 8 eine Trennschärfe von rund 0,75 für eine Differenz von 0,5. Für eine Differenz von 0,8 bei demselben Stichprobenumfang ergibt sich jedoch lediglich eine Trennschärfe von rund 0,24. Wenn für jeden Differenzwert der Stichprobenumfang vergrößert wird, steigt die Trennschärfe des Tests.

Trennschärfekurve

Die Trennschärfekurve zeigt die Trennschärfe des Tests im Vergleich zur Differenz (oder zum Verhältnis) zwischen dem Testmittelwert und dem Referenzmittelwert.

Interpretation

Mit der Trennschärfekurve können Sie den geeigneten Stichprobenumfang oder die angemessene Trennschärfe für einen Test ermitteln.

Die Trennschärfekurve stellt jede Kombination von Trennschärfe und Differenz (oder Verhältnis) für jeden Stichprobenumfang dar, wenn das Signifikanzniveau und die Standardabweichung (oder der Variationskoeffizient) konstant gehalten werden. Jedes Symbol auf der Trennschärfekurve stellt einen Wert dar, der auf der Grundlage der eingegebenen Werte berechnet wurde. Wenn Sie beispielsweise einen Wert für den Stichprobenumfang und einen Wert für die Trennschärfe eingeben, berechnet Minitab die entsprechende Differenz (bzw. das Verhältnis) und zeigt den berechneten Wert in der Grafik an.

Untersuchen Sie die Werte auf der Kurve, um die Differenz (oder das Verhältnis) zwischen Testmittelwert und Referenzmittelwert zu bestimmen, die bei einer bestimmten Trennschärfe und einem bestimmten Stichprobenumfang erkannt werden kann. Ein Trennschärfewert von 0,9 wird im Allgemeinen als geeignet angesehen. Einige Fachleute hingegen erachten einen Trennschärfewert von 0,8 als geeignet. Wenn ein Äquivalenztest eine zu geringe Trennschärfe aufweist, können Sie die Äquivalenz möglicherweise nicht nachweisen, selbst wenn die Mittelwerte der Grundgesamtheiten äquivalent sind. Wenn Sie den Stichprobenumfang vergrößern, nimmt auch die Trennschärfe des Tests zu. Es empfiehlt sich, dass eine ausreichende Anzahl von Beobachtungen in der Stichprobe vorliegen, um eine angemessene Trennschärfe zu erzielen. Der Stichprobenumfang sollte jedoch nicht so groß sein, dass Zeit und Geld bei der Stichprobennahme vergeudet oder irrelevante Differenzen als statistisch signifikant erkannt werden. Im Allgemeinen wird für Differenzen (oder Verhältnisse), die näher an den Äquivalenzgrenzen liegen, eine größere Trennschärfe benötigt, um die Äquivalenz nachzuweisen.

In dieser Grafik veranschaulicht die Trennschärfekurve für einen Stichprobenumfang von 8 (in jeder Gruppe), dass der Test für eine Differenz von ungefähr ±0,4 eine Trennschärfe von 0,9 aufweist. Die Trennschärfekurve für einen Stichprobenumfang von 12 zeigt, dass der Test für eine Differenz von ungefähr ±0,5 eine Trennschärfe von 0,9 aufweist. Die Trennschärfekurve für einen Stichprobenumfang von 12 zeigt, dass der Test für eine Differenz von ungefähr ±0,6 eine Trennschärfe von 0,9 aufweist. Bei jeder Kurve nimmt die Trennschärfe des Tests in dem Maße ab und nähert sich α (Alpha ist das Risiko, dass Äquivalenz behauptet wird, während tatsächlich keine vorliegt), in dem sich die Differenz der unteren bzw. oberen Äquivalenzgrenze nähert.