Methoden und Formeln für Stichprobenumfang für Toleranzintervalle

Wählen Sie die gewünschte Methode oder Formel aus.

Allgemeine Formeln für den Stichprobenumfang für Toleranzintervalle

Definition eines Toleranzintervalls (beidseitig)

Seien X1, X2, ..., Xn die geordneten Werte einer Zufallsstichprobe mit dem Umfang n aus einer stetigen Verteilung.

Die Verteilungsfunktion sei F(χ,θ) für Ω in einem Parameterraum mit einer Dimension größer als oder gleich 1.

Seien U < O zwei Statistiken, die auf der Stichprobe basieren, sodass für beliebige gegebene Werte für α und P bei 0 < α < 1 and 0 < P < 1 folgendes für jedes θ in Ω gilt:

Das Intervall [U; O] ist dann ein beidseitiges Toleranzintervall mit dem Inhalt = P x 100 % und dem Konfidenzniveau = 100(1 - α) %. Ein solches Intervall kann als beidseitiges (1 - α; P)-Toleranzintervall bezeichnet werden. Wenn beispielsweise α = 0,10 und P = 0,85, wird das resultierende Intervall als beidseitiges (90 %; 0,85)-Toleranzintervall bezeichnet.

Stichprobenumfang und Fehlerspanne

Sei C = F( O) – F(U). Für ein beidseitiges (1 –α ; P)-Toleranzintervall gilt Folgendes:
Hierbei ist C der Inhalt des Toleranzintervalls (auch als Abdeckung bezeichnet).
Faulkenberry und Weeks1 beschreiben das Stichprobenumfang-Problem für ein Toleranzintervall anhand der Fehlerspanne ε und der Wahrscheinlichkeit für die Fehlerspanne α*. Der Stichprobenumfang wird ausreichend groß gewählt, so dass die folgenden zwei Bedingungen erfüllt sind:
  • Die Wahrscheinlichkeit, dass das Intervall mindestens 100P % der Grundgesamtheit abdeckt, ist gleich 1 – α.
  • Die Wahrscheinlichkeit α*, dass das Intervall mehr als 100P* % der Grundgesamtheit abdeckt, ist klein, wobei P* = P + ε und ε > 0.

Mit anderen Worten, für gegebene Werte von P, α, ε und α* wird der Stichprobenumfang so bestimmt, dass Folgendes gilt:

und

Dieser Ansatz basiert auf dem Umstand, dass für ein beliebiges P* > P der Ausdruck P(C>P*) eine abnehmende Funktion des Stichprobenumfangs ist, mit der daher die Präzision ausgewertet werden kann.

Bei kleineren Werten für ε und α* wird der Umfang des Toleranzintervalls reduziert; daher ist ein größerer Stichprobenumfang erforderlich. Typische Werte von ε und α* sind 0,10; 0,05 und 0,01.

Sie können auch ε für bestimmte Werte von P, α, n und α* ermitteln.
Hinweis

Die oben genannten Definitionen und Konzepte gelten auch für einseitige Toleranzintervalle.

  1. Faulkenberry, G. D. und Weeks, D. L. (1968). Sample size determination for tolerance limits. Technometrics, 10, S. 343-8.

Berechnen des Stichprobenumfangs für Toleranzintervalle bei normalverteilten Daten

Einseitiges Intervall

Faulkenberry und Daly1 zeigen, dass bei gegebenen Werten von α, P, ε und α* der erforderliche Stichprobenumfang für ein einseitiges Intervall durch Berechnung des kleinsten n ermittelt werden kann, das folgende Gleichung erfüllt:

Hierbei stellt tx,y(d) das y-te Perzentil einer nicht zentralen t-Verteilung mit x Freiheitsgraden und dem Nichtzentralitätsparameter d dar. Die Nichtzentralitätsparameter δ und δ* werden wie folgt berechnet:

Hierbei ist zp das P-te Perzentil der Standardnormalverteilung.

Minitab verwendet einen iterativen Algorithmus, um den erforderlichen Mindestwert für n zu ermitteln.

Beidseitiges Intervall

Die Berechnungen des Stichprobenumfangs für ein beidseitiges Intervall, die auf der Funktion I( k, n, P) beruhen, finden Sie unter Methoden und Formeln für Toleranzintervalle (Normalverteilung); klicken Sie dort auf „Genaue Toleranzintervalle für Normalverteilungen“.

Faulkenberry und Daly1 zeigen, dass bei gegebenen Werten von α, P, ε und α* der erforderliche Stichprobenumfang für ein beidseitiges Intervall durch Berechnung des kleinsten n ermittelt werden kann, das folgende Gleichung für k1< k2 erfüllt:

Minitab verwendet einen iterativen Algorithmus, um den erforderlichen Mindestwert für n zu ermitteln. Weitere Informationen finden Sie in Odeh, Chou und Owen2.

Notation

BegriffBeschreibung
1 – αKonfidenzniveau für das Toleranzintervall
PAbdeckung des Toleranzintervalls (minimaler Soll-Prozentsatz der Grundgesamtheit im Intervall)
εFehlerspanne des Toleranzintervalls
α*Wahrscheinlichkeit für Fehlerspanne für das Toleranzintervall
nAnzahl der Beobachtungen in der Stichprobe
  1. Faulkenberry, G. D. und Daly, J. C. (1970). Sample size for tolerance limits on a normal distribution. Technometrics, 12, S. 813–21.
  2. Odeh, R. E., Chou, Y.-M. und Owen, D. B. (1987). The precision for coverages and sample size requirements for normal tolerance intervals. Communications in Statistics: Simulation and Computation, 16, S. 969–985.

Berechnen des Höchstprozentsatzes der Grundgesamtheit im Intervall für Toleranzintervalle bei normalverteilten Daten

Minitab berechnet die Intervalle für die Fehlerspanne; anschließend wird das Intervall für den Höchstprozentsatz der Grundgesamtheit im Intervall mit der folgenden Formel berechnet.

P* = P + ε

Die Berechnungen für die Fehlerspanne ähneln den unter Allgemeine Formeln für den Stichprobenumfang für Toleranzintervalle beschriebenen Berechnungen des Stichprobenumfangs.

Einseitige Intervalle

Für gegebene Werte von n, α, P und α* wird die Fehlerspanne ε für ein einseitiges Intervall berechnet, indem zunächst die folgende Gleichung nach δ* aufgelöst wird:

Hierbei stellt tx,y(d) das y-te Perzentil einer nicht zentralen t-Verteilung mit x Freiheitsgraden und dem Nichtzentralitätsparameter d dar. Zur Berechnung von δ* verwendet Minitab eine numerische Routine zur Wurzelermittlung. Nachdem der Wert von δ* ermittelt wurde, lässt sich ε mit der folgenden Formel berechnen:

Beidseitige Intervalle

Die Berechnungen für die Fehlerspanne eines beidseitigen Intervalls beruhen auf der Funktion I( k, n, P), die unter Genaue Toleranzintervalle für Normalverteilungen beschrieben wird.

Für gegebene Werte von n, α, P und α* wird die Fehlerspanne ε für ein beidseitiges Intervall anhand des von Odeh, Chou, and Owen1 beschriebenen Algorithmus berechnet. Zunächst wird die folgende Gleichung nach k aufgelöst:

Als Nächstes wird der Wert von k verwendet, um die folgende Gleichung nach ε aufzulösen:

Notation

BegriffBeschreibung
1 – αKonfidenzniveau für das Toleranzintervall
PAbdeckung des Toleranzintervalls (minimaler Soll-Prozentsatz der Grundgesamtheit im Intervall)
P*Höchstprozentsatz der Grundgesamtheit im Intervall
εFehlerspanne des Toleranzintervalls
α*Wahrscheinlichkeit für Fehlerspanne für das Toleranzintervall
nAnzahl der Beobachtungen in der Stichprobe
  1. Odeh, R. E., Chou, Y.-M. und Owen, D. B. (1987). The precision for coverages and sample size requirements for normal tolerance intervals. Communications in Statistics: Simulation and Computation, 16, S. 969–985.

Berechnen von Stichprobenumfang und akzeptablen Höchstprozentsätzen der Grundgesamtheit im Intervall für verteilungsfreie Toleranzintervalle

Eine einseitige untere (1 – α; P)-Toleranzgrenze wird mit Xk angegeben, wobei k die größte ganze Zahl ist, die die folgende Bedingung erfüllt:
Hierbei ist Y eine binomiale Zufallsvariable mit den Parametern n und 1 – P. Äquivalent ist nk die kleinste ganze Zahl, bei der P(Wnk) ≥ 1 – α, wobei W = nY eine binomiale Zufallsvariable mit den Parametern n und P ist.

Das heißt, nk = FW–1 (1 – α), wobei FW–1(.) die inverse kumulative Verteilungsfunktion von W = nY darstellt.

Ebenso kann gezeigt werden, dass eine einseitige obere (1 – α; P)-Toleranzgrenze mit X( nk + 1) angegeben wird, wobei k die oben genannten Bedingungen für die Untergrenze erfüllt.

In beiden Fällen wird die tatsächliche oder effektive Abdeckung als P(Y > k) angegeben.

Darüber hinaus kann ein beidseitiges (1 – α; P)-Toleranzintervall als (Xr; Xs) angegeben werden, wobei k = sr die kleinste ganze Zahl ist, die die folgende Bedingung erfüllt:
wobei V eine binomiale Zufallsvariable mit den Parametern n und P ist. Das heißt, k – 1 = Fv–1(1 – α), wobei Fv–1(.) die inverse kumulative Verteilungsfunktion von W = nY darstellt.

Es ist mittlerweile gängige Praxis, s = nr + 1 zu verwenden, so dass r = ( nk + 1) / 2. Sowohl r als auch s werden auf die nächste ganze Zahl abgerundet. Die tatsächliche oder effektive Abdeckung wird als P(Vk – 1) angegeben.

Kriterium

Das Kriterium für Berechnungen des Stichprobenumfangs für verteilungsfreie Toleranzintervalle (sowohl einseitige als auch beidseitige) ähnelt dem, das für normalverteilte Daten beschrieben wurde. Konkreter heißt dies, für eine einseitige untere (1 – α; P)-Toleranzgrenze umfasst das Kriterium das Ermitteln des Stichprobenumfangs n und der größten ganzen Zahl k, die die folgenden Bedingungen erfüllen:

wobei Y eine binomiale Zufallsvariable mit den Parametern n und 1 – P sowie Y* eine binomiale Zufallsvariable mit den Parametern n and 1– P* ist, und P* = P + ε und ε > 0.

Diese Bedingung entspricht dem Ermitteln von n und der größten ganzen Zahl k, die die folgenden Bedingungen erfüllen:

wobei FU(.) die kumulative Verteilungsfunktion einer Zufallsvariablen U darstellt, die einer Betaverteilung mit den Parametern α = k und b = nk + 1 folgt.

Wie in Hahn und Meeker1 dargelegt, liefert das Kriterium sowohl für einseitige als auch für beidseitige Toleranzintervalle identische Anforderungen an den Stichprobenumfang. Daher verwenden wir das oben genannte Kriterium für einseitige und beidseitige Toleranzintervalle.

Für gegebene Werte von ε, P und α* ermittelt Minitab mit einem iterativen Algorithmus den minimalen Stichprobenumfang, der die oben beschriebenen zwei Bedingungen erfüllt. Für gegebene Werte von n, P und α* berechnet Minitab zudem mit einem iterativen Algorithmus die Fehlerspanne, die die oben genannten Bedingungen erfüllt, und berechnet anschließend das Intervall für den akzeptablen Höchstprozentsatz der Grundgesamtheit im Intervall anhand der folgenden Formel.

P* = P + ε

Weitere Einzelheiten können Sie Hahn und Meeker1 entnehmen.

Notation

BegriffBeschreibung
1 - αKonfidenzniveau für das Toleranzintervall
PAbdeckung des Toleranzintervalls (minimaler Soll-Prozentsatz der Grundgesamtheit im Intervall)
P*Höchstprozentsatz der Grundgesamtheit im Intervall
εFehlerspanne des Toleranzintervalls
α*Wahrscheinlichkeit für Fehlerspanne für das Toleranzintervall
nAnzahl der Beobachtungen in der Stichprobe
  1. Hahn, G. J. und Meeker, W. Q. (1991), Statistical Intervals: A Guide for Practitioners. John Wiley & Sons, 170.