Interpretieren aller Statistiken und Grafiken für Trennschärfe und Stichprobenumfang für Äquivalenztest, verbundene Stichproben

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken und Grafiken, die für „Trennschärfe und Stichprobenumfang für Äquivalenztest, verbundene Stichproben“ bereitgestellt werden.

Trennschärfe für Differenz

In der ersten Zeile der Ausgabe wird angegeben, wie die Hypothesen für den Äquivalenztest ausgedrückt wurden.

„Trennschärfe für Differenz“ gibt an, dass die Hypothesen als Differenz zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit (Testmittelwert – Referenzmittelwert) ausgedrückt wurden.

Trennschärfe für Verhältnis

In der ersten Zeile der Ausgabe wird angegeben, wie die Hypothesen für den Äquivalenztest ausgedrückt wurden.

„Trennschärfe für Verhältnis“ gibt an, dass die Hypothesen als Verhältnis zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit durch Log-Transformation (Testmittelwert / Referenzmittelwert) ausgedrückt wurden.

Nullhypothese und Alternativhypothese

Die Nullhypothese und die Alternativhypothese sind einander ausschließende Aussagen über eine Grundgesamtheit. In einem Äquivalenztest wird anhand von Stichprobendaten bestimmt, ob die Nullhypothese zurückgewiesen werden muss.
Nullhypothese
Minitab testet je nach ausgewählter Alternativhypothese eine oder beide der folgenden Nullhypothesen:
  • Die Differenz (oder das Verhältnis) zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist größer als die oder gleich der oberen Äquivalenzgrenze.
  • Die Differenz (oder das Verhältnis) zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist kleiner als die oder gleich der unteren Äquivalenzgrenze.
Alternativhypothese
Mit der Alternativhypothese werden eine bzw. beide der folgenden Aussagen getroffen:
  • Die Differenz (oder das Verhältnis) zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist kleiner als die obere Äquivalenzgrenze.
  • Die Differenz (oder das Verhältnis) zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist größer als die untere Äquivalenzgrenze.

Interpretation

Verwenden Sie die Nullhypothese und die Alternativhypothese, um die Richtigkeit der Äquivalenzkriterien zu bestätigen und um zu prüfen, ob Sie die geeignete zu testende Alternativhypothese ausgewählt haben.

Äquivalenztest bei verbundenen Stichproben Methode Trennschärfe für Differenz: Testmittelwert - Referenzmittelwert Nullhypothese: Differenz ≤ -0,5 oder Differenz ≥ 0,5 Alternativhypothese: -0,5 < Differenz < 0,5 α-Niveau: 0,05 Angenommene Standardabweichung der paarweisen Differenzen = 0,42

In diesen Ergebnissen testet Minitab zwei Nullhypothesen:
  • Die Differenz zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist kleiner oder gleich der unteren Äquivalenzgrenze von −0,5.
  • Die Differenz zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit ist größer oder gleich der oberen Äquivalenzgrenze von 0,5.
Die Alternativhypothese besagt, dass die Differenz zwischen der unteren und der oberen Äquivalenzgrenze liegt (d. h., dass der Mittelwert der Testgrundgesamtheit äquivalent zum Mittelwert der Referenzgrundgesamtheit ist).

α (Alpha)

Das Signifikanzniveau (als Alpha oder α bezeichnet) ist das maximal akzeptable Risiko, dass die Nullhypothese zurückgewiesen wird, wenn sie tatsächlich wahr ist (Fehler 1. Art). Wenn Sie beispielsweise einen Äquivalenztest mit den Standardhypothesen durchführen, gibt ein α von 0,05 ein Risiko von 5 % an, dass auf eine Äquivalenz geschlossen wird, wenn die Differenz zwischen dem Testmittelwert und dem Referenzmittelwert tatsächlich nicht innerhalb der Äquivalenzgrenzen liegt.

Das α-Niveau für einen Äquivalenztest bestimmt auch das Konfidenzniveau für das Konfidenzintervall. In der Standardeinstellung beträgt das Konfidenzniveau (1 – α) x 100 %. Wenn Sie die alternative Berechnungsmethode für das Konfidenzintervall anwenden, ist das Konfidenzniveau (1 – 2α) x 100 %.

Interpretation

Verwenden Sie das Signifikanzniveau, um den Trennschärfewert des Tests zu minimieren, wenn die Nullhypothese (H0) wahr ist. Bei höheren Signifikanzniveaus ist der Test trennschärfer, gleichzeitig steigt jedoch die Wahrscheinlichkeit, dass ein Fehler 1. Art auftritt, beim dem die Nullhypothese zurückgewiesen wird, wenn diese tatsächlich wahr ist.

Angenommene Standardabweichung

Die Standardabweichung der Differenzen ist ein Maß für die Streuung bzw. die Streubreite der verbundenen Differenzen um den Mittelwert der verbundenen Differenzen. Eine zufällige oder natürliche Streuung eines Prozesses wird häufig auch als Rauschen bezeichnet.

Interpretation

Die angenommene Standardabweichung ist ein Schätzwert der Standardabweichung der Grundgesamtheit, die Sie für die Analyse der Trennschärfe eingeben. Minitab verwendet die angenommene Standardabweichung, um die Trennschärfe des Tests zu berechnen. Höhere Werte der Standardabweichung verweisen auf eine stärkere Streuung bzw. ein stärkeres „Rauschen“ der Daten, was die statistische Trennschärfe des Tests reduziert.

Differenz

Dieser Wert stellt die Differenz zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit dar.

Hinweis

Die Definitionen und Anleitungen zur Interpretation in diesem Artikel beziehen sich auf einen Standardtest der Äquivalenz, bei dem die Standard-Alternativhypothese (Untergrenze < Testmittelwert - Referenzmittelwert < Obergrenze) verwendet wird.

Interpretation

Wenn Sie den Stichprobenumfang und die Trennschärfe für den Test eingeben, berechnet Minitab die Differenz, die mit dem Test bei den angegebenen Werten für Trennschärfe und Stichprobenumfang erkannt werden kann. Bei größeren Stichprobenumfängen kann die Differenz näher an den Äquivalenzgrenzen liegen.

Wenn Sie die Beziehung zwischen dem Stichprobenumfang und der Differenz bei einer bestimmten Trennschärfe eingehender untersuchen möchten, verwenden Sie die Trennschärfekurve.

Diese Ergebnisse zeigen, dass mit zunehmendem Stichprobenumfang die Größe der Differenz zunimmt, die vom Test bei einer bestimmten Trennschärfe erkannt werden kann:

  • Bei 10 Beobachtungspaaren beträgt die Trennschärfe des Tests mindestens 0,9, wenn die Differenz zwischen ungefähr −0,07 und 0,07 liegt.
  • Bei 15 Beobachtungspaaren beträgt die Trennschärfe des Tests mindestens 0,9, wenn die Differenz zwischen ungefähr −0,17 und 0,17 liegt.
  • Bei 20 Beobachtungspaaren beträgt die Trennschärfe des Tests mindestens 0,9, wenn die Differenz zwischen ungefähr −0,21 und 0,21 liegt.

Power and Sample Size

Equivalence Test with Paired Data Power for difference: Test mean - reference mean Null hypothesis: Difference ≤ -0.5 or Difference ≥ 0.5 Alternative hypothesis: -0.5 < Difference < 0.5 α level: 0.05 Assumed standard deviation of paired differences = 0.42
Sample Size Power Difference 10 0.9 -0.068351 10 0.9 0.068351 15 0.9 -0.165953 15 0.9 0.165953 20 0.9 -0.214756 20 0.9 0.214756

Verhältnis

Dieser Wert stellt das Verhältnis zwischen dem Mittelwert der Testgrundgesamtheit und dem Mittelwert der Referenzgrundgesamtheit dar. Zum Durchführen von Trennschärfeberechnungen für ein Verhältnis müssen Sie eine Hypothese zu Testmittelwert / Referenzmittelwert (Verhältnis, durch Log-Transformation) auswählen.

Hinweis

Die Definitionen und Anleitungen zur Interpretation in diesem Artikel beziehen sich auf einen Äquivalenztest, bei dem die Standard-Alternativhypothese für das Verhältnis (Untergrenze < Testmittelwert / Referenzmittelwert < Obergrenze) verwendet wird.

Interpretation

Wenn Sie den Stichprobenumfang und die Trennschärfe für den Test eingeben, berechnet Minitab das minimale und das maximale Verhältnis, das mit dem Test bei den angegebenen Werten für Trennschärfe und Stichprobenumfang erkannt werden kann. Bei größeren Stichprobenumfängen kann das Verhältnis näher an den Äquivalenzgrenzen liegen.

Wenn Sie die Beziehung zwischen dem Stichprobenumfang und den Verhältnissen bei einer bestimmten Trennschärfe eingehender untersuchen möchten, verwenden Sie die Trennschärfekurve.

Power and Sample Size

Equivalence Test with Paired Data Power for ratio: Test mean / reference mean Null hypothesis: Ratio ≤ 0.9 or Ratio ≥ 1.1 Alternative hypothesis: 0.9 < Ratio < 1.1 α level: 0.05 Assumed standard deviation of paired differences of log transformed data = 0.08
Sample Size Power Ratio 10 0.9 0.97588 10 0.9 1.01447 30 0.9 0.94028 30 0.9 1.05288 50 0.9 0.93073 50 0.9 1.06368

Die folgenden Ergebnisse zeigen beispielsweise, wie der Bereich der Verhältnisse, die vom Test bei einer bestimmten Trennschärfe erkannt werden können, durch Vergrößern des Stichprobenumfangs zunimmt:

  • Bei 10 Beobachtungspaaren beträgt die Trennschärfe des Tests mindestens 0,9, wenn das Verhältnis zwischen ungefähr 0,98 und 1,01 liegt.
  • Bei 30 Beobachtungspaaren beträgt die Trennschärfe des Tests mindestens 0,9, wenn das Verhältnis zwischen ungefähr 0,94 und 1,05 liegt.
  • Bei 50 Beobachtungspaaren beträgt die Trennschärfe des Tests mindestens 0,9, wenn das Verhältnis zwischen ungefähr 0,93 und 1,06 liegt.

Stichprobenumfang

Der Stichprobenumfang gibt die Gesamtzahl der Beobachtungen in der Stichprobe an.

Interpretation

Anhand des Stichprobenumfangs können Sie schätzen, wie viele Beobachtungen Sie benötigen, um bei einer angegebenen Differenz eine bestimmte Trennschärfe für den Äquivalenztest zu erreichen.

Wenn Sie eine Differenz (oder ein Verhältnis) und einen Trennschärfewert für den Test eingeben, berechnet Minitab, wie groß die Stichprobe sein muss. Da der Stichprobenumfang als ganze Zahl angegeben wird, kann die tatsächliche Trennschärfe des Tests etwas höher als der von Ihnen angegebene Trennschärfewert ausfallen.

Wenn Sie den Stichprobenumfang vergrößern, nimmt auch die Trennschärfe des Tests zu. Es empfiehlt sich, dass eine ausreichende Anzahl von Beobachtungen in der Stichprobe vorliegen, um eine angemessene Trennschärfe zu erzielen. Der Stichprobenumfang sollte jedoch nicht so groß sein, dass Zeit und Geld bei der Stichprobennahme vergeudet oder irrelevante Differenzen als statistisch signifikant erkannt werden.

Wenn Sie die Beziehung zwischen dem Stichprobenumfang und der Differenz (oder dem Verhältnis), die bzw. das mit dem Test bei einer bestimmten Trennschärfe erkannt werden kann, eingehender untersuchen möchten, verwenden Sie die Trennschärfekurve.

Trennschärfe und Stichprobenumfang

Äquivalenztest bei verbundenen Stichproben Methode Trennschärfe für Differenz: Testmittelwert - Referenzmittelwert Nullhypothese: Differenz ≤ -0,5 oder Differenz ≥ 0,5 Alternativhypothese: -0,5 < Differenz < 0,5 α-Niveau: 0,05 Angenommene Standardabweichung der paarweisen Differenzen = 0,42
Ergebnisse Differenz Stichprobenumfang Soll-Trennschärfe Ist-Trennschärfe 0,0 10 0,9 0,930853 0,1 12 0,9 0,923863 0,2 19 0,9 0,911237 0,3 40 0,9 0,905568 0,4 153 0,9 0,900966

Diese Ergebnisse zeigen, dass Sie einen größeren Stichprobenumfang benötigen, um eine bestimmte Trennschärfe zu erreichen, wenn die Differenz zunimmt und sich an die Äquivalenzgrenze annähert. Bei einer Differenz von 0 benötigen Sie zehn Paare von Beobachtungen, um eine Trennschärfe von 0,9 zu erreichen. Bei einer Differenz von 0,4 sind mindestens 153 Paare von Beobachtungen erforderlich, um eine Trennschärfe von 0,9 zu erreichen.

Trennschärfe

Die Trennschärfe eines Äquivalenztests ist die Wahrscheinlichkeit, mit der der Test nachweist, dass die Differenz innerhalb der Äquivalenzgrenzen liegt, wenn dies tatsächlich der Fall ist. Die Trennschärfe eines Äquivalenztests wird vom Stichprobenumfang, der Differenz, den Äquivalenzgrenzen, der Streuung der Daten und dem Signifikanzniveau des Tests beeinflusst.

Weitere Informationen finden Sie unter Trennschärfe für Äquivalenztests.

Interpretation

Wenn Sie einen Stichprobenumfang und eine Differenz (oder ein Verhältnis) eingeben, berechnet Minitab die Trennschärfe des Tests. Ein Trennschärfewert von mindestens 0,9 wird im Allgemeinen als geeignet angesehen. Eine Trennschärfe von 0,9 bedeutet, dass mit dem Test mit einer Wahrscheinlichkeit von 90 % Äquivalenz nachgewiesen wird, sofern die Differenz (oder das Verhältnis) zwischen den Mittelwerten der Grundgesamtheiten tatsächlich innerhalb der Äquivalenzgrenzen liegt. Wenn ein Äquivalenztest eine zu geringe Trennschärfe aufweist, können Sie die Äquivalenz möglicherweise nicht nachweisen, selbst wenn der Test-Mittelwert und der Referenzmittelwert äquivalent sind.

In der Regel weist der Test bei einem kleineren Stichprobenumfang oder einer Differenz (bzw. einem Verhältnis), die (bzw. das) näher an einer Äquivalenzgrenze liegt, eine geringere Trennschärfe zum Nachweisen einer Äquivalenz auf.

Trennschärfe und Stichprobenumfang

Äquivalenztest bei verbundenen Stichproben Methode Trennschärfe für Differenz: Testmittelwert - Referenzmittelwert Nullhypothese: Differenz ≤ -0,5 oder Differenz ≥ 0,5 Alternativhypothese: -0,5 < Differenz < 0,5 α-Niveau: 0,05 Angenommene Standardabweichung der paarweisen Differenzen = 0,42
Ergebnisse Differenz Stichprobenumfang Trennschärfe 0,1 8 0,756885 0,1 15 0,968213 0,2 8 0,564674 0,2 15 0,837476 0,3 8 0,333618 0,3 15 0,543547

In diesen Ergebnissen ergibt sich aus dem Stichprobenumfang 15 eine Trennschärfe von ungefähr 0,97 für eine Differenz von 0,1. Bei demselben Stichprobenumfang ergibt sich jedoch für eine Differenz von 0,2 eine Trennschärfe von 0,84 und für eine Differenz 0,3 eine Trennschärfe von 0,54. Wenn für jeden Differenzwert der Stichprobenumfang vergrößert wird, steigt die Trennschärfe des Tests.

Trennschärfekurve

Die Trennschärfekurve zeigt die Trennschärfe des Tests im Vergleich zur Differenz zwischen dem Testmittelwert und dem Referenzmittelwert.

Interpretation

Mit der Trennschärfekurve können Sie den geeigneten Stichprobenumfang oder die angemessene Trennschärfe für einen Test ermitteln.

Die Trennschärfekurve stellt jede Kombination von Trennschärfe und Differenz (oder Verhältnis) für jeden Stichprobenumfang dar, wenn das Signifikanzniveau und die Standardabweichung (oder der Variationskoeffizient) konstant gehalten werden. Jedes Symbol auf der Trennschärfekurve stellt einen Wert dar, der auf der Grundlage der eingegebenen Werte berechnet wurde. Wenn Sie beispielsweise einen Wert für den Stichprobenumfang und einen Wert für die Trennschärfe eingeben, berechnet Minitab die entsprechende Differenz (bzw. das Verhältnis) und zeigt den berechneten Wert in der Grafik an.

Untersuchen Sie die Werte auf der Kurve, um die Differenz (oder das Verhältnis) zwischen Testmittelwert und Referenzmittelwert zu bestimmen, die bei einer bestimmten Trennschärfe und einem bestimmten Stichprobenumfang erkannt werden kann. Ein Trennschärfewert von 0,9 wird im Allgemeinen als geeignet angesehen. Einige Fachleute hingegen erachten einen Trennschärfewert von 0,8 als geeignet. Wenn ein Äquivalenztest eine zu geringe Trennschärfe aufweist, können Sie die Äquivalenz möglicherweise nicht nachweisen, selbst wenn die Mittelwerte der Grundgesamtheiten äquivalent sind. Wenn Sie den Stichprobenumfang vergrößern, nimmt auch die Trennschärfe des Tests zu. Es empfiehlt sich, dass eine ausreichende Anzahl von Beobachtungen in der Stichprobe vorliegen, um eine angemessene Trennschärfe zu erzielen. Der Stichprobenumfang sollte jedoch nicht so groß sein, dass Zeit und Geld bei der Stichprobennahme vergeudet oder irrelevante Differenzen als statistisch signifikant erkannt werden. Im Allgemeinen wird für Differenzen (oder Verhältnisse), die näher an den Äquivalenzgrenzen liegen, eine größere Trennschärfe benötigt, um die Äquivalenz nachzuweisen.

In dieser Grafik veranschaulicht die Trennschärfekurve für einen Stichprobenumfang von 10, dass der Test für eine Differenz von ca. ±0,1 eine Trennschärfe von 0,9 aufweist. Die Trennschärfekurve für einen Stichprobenumfang von 20 zeigt, dass der Test für eine Differenz von ca. ±0,2 eine Trennschärfe von 0,9 aufweist. Bei jeder Kurve nimmt die Trennschärfe des Tests in dem Maße ab und nähert sich α (Alpha ist das Risiko, dass Äquivalenz behauptet wird, während tatsächlich keine vorliegt), in dem sich die Differenz der unteren bzw. oberen Äquivalenzgrenze nähert.

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien