Methoden und Formeln für Stichprobenumfang für Toleranzintervalle

Wählen Sie die gewünschte Methode oder Formel aus.

In diesem Thema

Allgemeine Formeln für den Stichprobenumfang für Toleranzintervalle
Berechnen des Stichprobenumfangs für Toleranzintervalle bei normalverteilten Daten
Berechnen des Höchstprozentsatzes der Grundgesamtheit im Intervall für Toleranzintervalle bei normalverteilten Daten
Berechnen von Stichprobenumfang und akzeptablen Höchstprozentsätzen der Grundgesamtheit im Intervall für verteilungsfreie Toleranzintervalle

Allgemeine Formeln für den Stichprobenumfang für Toleranzintervalle

Definition eines Toleranzintervalls (beidseitig)

Seien X₁, X₂, ..., X_n die geordneten Werte einer Zufallsstichprobe mit dem Umfang n aus einer stetigen Verteilung.

Die Verteilungsfunktion sei F(χ,θ) für Ω in einem Parameterraum mit einer Dimension größer als oder gleich 1.

Seien U < O zwei Statistiken, die auf der Stichprobe basieren, sodass für beliebige gegebene Werte für α und P bei 0 < α < 1 and 0 < P < 1 folgendes für jedes θ in Ω gilt:

Das Intervall [U; O] ist dann ein beidseitiges Toleranzintervall mit dem Inhalt = P x 100 % und dem Konfidenzniveau = 100(1 - α) %. Ein solches Intervall kann als beidseitiges (1 - α; P)-Toleranzintervall bezeichnet werden. Wenn beispielsweise α = 0,10 und P = 0,85, wird das resultierende Intervall als beidseitiges (90 %; 0,85)-Toleranzintervall bezeichnet.

Stichprobenumfang und Fehlerspanne

Sei C = F( O) – F(U). Für ein beidseitiges (1 –α ; P)-Toleranzintervall gilt Folgendes:

Hierbei ist C der Inhalt des Toleranzintervalls (auch als Abdeckung bezeichnet).

Faulkenberry und Weeks¹ beschreiben das Stichprobenumfang-Problem für ein Toleranzintervall anhand der Fehlerspanne ε und der Wahrscheinlichkeit für die Fehlerspanne α*. Der Stichprobenumfang wird ausreichend groß gewählt, so dass die folgenden zwei Bedingungen erfüllt sind:

Die Wahrscheinlichkeit, dass das Intervall mindestens 100P % der Grundgesamtheit abdeckt, ist gleich 1 – α.
Die Wahrscheinlichkeit α*, dass das Intervall mehr als 100P* % der Grundgesamtheit abdeckt, ist klein, wobei P* = P + ε und ε > 0.

Mit anderen Worten, für gegebene Werte von P, α, ε und α* wird der Stichprobenumfang so bestimmt, dass Folgendes gilt:

und

Dieser Ansatz basiert auf dem Umstand, dass für ein beliebiges P* > P der Ausdruck P(C>P*) eine abnehmende Funktion des Stichprobenumfangs ist, mit der daher die Präzision ausgewertet werden kann.

Bei kleineren Werten für ε und α* wird der Umfang des Toleranzintervalls reduziert; daher ist ein größerer Stichprobenumfang erforderlich. Typische Werte von ε und α* sind 0,10; 0,05 und 0,01.

Sie können auch ε für bestimmte Werte von P, α, n und α* ermitteln.

Hinweis

Die oben genannten Definitionen und Konzepte gelten auch für einseitige Toleranzintervalle.

Faulkenberry, G. D. und Weeks, D. L. (1968). Sample size determination for tolerance limits. Technometrics, 10, S. 343-8.

Berechnen des Stichprobenumfangs für Toleranzintervalle bei normalverteilten Daten

Einseitiges Intervall

Faulkenberry und Daly¹ zeigen, dass bei gegebenen Werten von α, P, ε und α* der erforderliche Stichprobenumfang für ein einseitiges Intervall durch Berechnung des kleinsten n ermittelt werden kann, das folgende Gleichung erfüllt:

Hierbei stellt t_x,y(d) das y-te Perzentil einer nicht zentralen t-Verteilung mit x Freiheitsgraden und dem Nichtzentralitätsparameter d dar. Die Nichtzentralitätsparameter δ und δ* werden wie folgt berechnet:

Hierbei ist z_p das P-te Perzentil der Standardnormalverteilung.

Minitab verwendet einen iterativen Algorithmus, um den erforderlichen Mindestwert für n zu ermitteln.

Beidseitiges Intervall

Die Berechnungen des Stichprobenumfangs für ein beidseitiges Intervall, die auf der Funktion I( k, n, P) beruhen, finden Sie unter Methoden und Formeln für Toleranzintervalle (Normalverteilung); klicken Sie dort auf „Genaue Toleranzintervalle für Normalverteilungen“.

Faulkenberry und Daly¹ zeigen, dass bei gegebenen Werten von α, P, ε und α* der erforderliche Stichprobenumfang für ein beidseitiges Intervall durch Berechnung des kleinsten n ermittelt werden kann, das folgende Gleichung für k₁< k₂ erfüllt:

Minitab verwendet einen iterativen Algorithmus, um den erforderlichen Mindestwert für n zu ermitteln. Weitere Informationen finden Sie in Odeh, Chou und Owen².

Notation

Begriff	Beschreibung
1 – α	Konfidenzniveau für das Toleranzintervall
P	Abdeckung des Toleranzintervalls (minimaler Soll-Prozentsatz der Grundgesamtheit im Intervall)
ε	Fehlerspanne des Toleranzintervalls
α*	Wahrscheinlichkeit für Fehlerspanne für das Toleranzintervall
n	Anzahl der Beobachtungen in der Stichprobe

Faulkenberry, G. D. und Daly, J. C. (1970). Sample size for tolerance limits on a normal distribution. Technometrics, 12, S. 813–21.
Odeh, R. E., Chou, Y.-M. und Owen, D. B. (1987). The precision for coverages and sample size requirements for normal tolerance intervals. Communications in Statistics: Simulation and Computation, 16, S. 969–985.

Berechnen des Höchstprozentsatzes der Grundgesamtheit im Intervall für Toleranzintervalle bei normalverteilten Daten

Minitab berechnet die Intervalle für die Fehlerspanne; anschließend wird das Intervall für den Höchstprozentsatz der Grundgesamtheit im Intervall mit der folgenden Formel berechnet.

P* = P + ε

Die Berechnungen für die Fehlerspanne ähneln den unter Allgemeine Formeln für den Stichprobenumfang für Toleranzintervalle beschriebenen Berechnungen des Stichprobenumfangs.

Einseitige Intervalle

Für gegebene Werte von n, α, P und α* wird die Fehlerspanne ε für ein einseitiges Intervall berechnet, indem zunächst die folgende Gleichung nach δ* aufgelöst wird:

Hierbei stellt t_x,y(d) das y-te Perzentil einer nicht zentralen t-Verteilung mit x Freiheitsgraden und dem Nichtzentralitätsparameter d dar. Zur Berechnung von δ* verwendet Minitab eine numerische Routine zur Wurzelermittlung. Nachdem der Wert von δ* ermittelt wurde, lässt sich ε mit der folgenden Formel berechnen:

Beidseitige Intervalle

Die Berechnungen für die Fehlerspanne eines beidseitigen Intervalls beruhen auf der Funktion I( k, n, P), die unter Genaue Toleranzintervalle für Normalverteilungen beschrieben wird.

Für gegebene Werte von n, α, P und α* wird die Fehlerspanne ε für ein beidseitiges Intervall anhand des von Odeh, Chou, and Owen¹ beschriebenen Algorithmus berechnet. Zunächst wird die folgende Gleichung nach k aufgelöst:

Als Nächstes wird der Wert von k verwendet, um die folgende Gleichung nach ε aufzulösen:

Notation

Begriff	Beschreibung
1 – α	Konfidenzniveau für das Toleranzintervall
P	Abdeckung des Toleranzintervalls (minimaler Soll-Prozentsatz der Grundgesamtheit im Intervall)
P*	Höchstprozentsatz der Grundgesamtheit im Intervall
ε	Fehlerspanne des Toleranzintervalls
α*	Wahrscheinlichkeit für Fehlerspanne für das Toleranzintervall
n	Anzahl der Beobachtungen in der Stichprobe

Odeh, R. E., Chou, Y.-M. und Owen, D. B. (1987). The precision for coverages and sample size requirements for normal tolerance intervals. Communications in Statistics: Simulation and Computation, 16, S. 969–985.

Berechnen von Stichprobenumfang und akzeptablen Höchstprozentsätzen der Grundgesamtheit im Intervall für verteilungsfreie Toleranzintervalle

Eine einseitige untere (1 – α; P)-Toleranzgrenze wird mit X_k angegeben, wobei k die größte ganze Zahl ist, die die folgende Bedingung erfüllt:

Hierbei ist Y eine binomiale Zufallsvariable mit den Parametern n und 1 – P. Äquivalent ist n – k die kleinste ganze Zahl, bei der P(W ≤ n – k) ≥ 1 – α, wobei W = n – Y eine binomiale Zufallsvariable mit den Parametern n und P ist.

Das heißt, n – k = F_W^–1 (1 – α), wobei F_W^–1(.) die inverse kumulative Verteilungsfunktion von W = n – Y darstellt.

Ebenso kann gezeigt werden, dass eine einseitige obere (1 – α; P)-Toleranzgrenze mit X_{( n – k + 1)} angegeben wird, wobei k die oben genannten Bedingungen für die Untergrenze erfüllt.

In beiden Fällen wird die tatsächliche oder effektive Abdeckung als P(Y > k) angegeben.

Darüber hinaus kann ein beidseitiges (1 – α; P)-Toleranzintervall als (X_r; X_s) angegeben werden, wobei k = s – r die kleinste ganze Zahl ist, die die folgende Bedingung erfüllt:

wobei V eine binomiale Zufallsvariable mit den Parametern n und P ist. Das heißt, k – 1 = F_v^–1(1 – α), wobei F_v^–1(.) die inverse kumulative Verteilungsfunktion von W = n – Y darstellt.

Es ist mittlerweile gängige Praxis, s = n – r + 1 zu verwenden, so dass r = ( n – k + 1) / 2. Sowohl r als auch s werden auf die nächste ganze Zahl abgerundet. Die tatsächliche oder effektive Abdeckung wird als P(V ≤ k – 1) angegeben.

Kriterium

Das Kriterium für Berechnungen des Stichprobenumfangs für verteilungsfreie Toleranzintervalle (sowohl einseitige als auch beidseitige) ähnelt dem, das für normalverteilte Daten beschrieben wurde. Konkreter heißt dies, für eine einseitige untere (1 – α; P)-Toleranzgrenze umfasst das Kriterium das Ermitteln des Stichprobenumfangs n und der größten ganzen Zahl k, die die folgenden Bedingungen erfüllen:

wobei Y eine binomiale Zufallsvariable mit den Parametern n und 1 – P sowie Y* eine binomiale Zufallsvariable mit den Parametern n and 1– P* ist, und P* = P + ε und ε > 0.

Diese Bedingung entspricht dem Ermitteln von n und der größten ganzen Zahl k, die die folgenden Bedingungen erfüllen:

wobei F_U(.) die kumulative Verteilungsfunktion einer Zufallsvariablen U darstellt, die einer Betaverteilung mit den Parametern α = k und b = n – k + 1 folgt.

Wie in Hahn und Meeker¹ dargelegt, liefert das Kriterium sowohl für einseitige als auch für beidseitige Toleranzintervalle identische Anforderungen an den Stichprobenumfang. Daher verwenden wir das oben genannte Kriterium für einseitige und beidseitige Toleranzintervalle.

Für gegebene Werte von ε, P und α* ermittelt Minitab mit einem iterativen Algorithmus den minimalen Stichprobenumfang, der die oben beschriebenen zwei Bedingungen erfüllt. Für gegebene Werte von n, P und α* berechnet Minitab zudem mit einem iterativen Algorithmus die Fehlerspanne, die die oben genannten Bedingungen erfüllt, und berechnet anschließend das Intervall für den akzeptablen Höchstprozentsatz der Grundgesamtheit im Intervall anhand der folgenden Formel.

P* = P + ε

Weitere Einzelheiten können Sie Hahn und Meeker¹ entnehmen.

Notation

Begriff	Beschreibung
1 - α	Konfidenzniveau für das Toleranzintervall
P	Abdeckung des Toleranzintervalls (minimaler Soll-Prozentsatz der Grundgesamtheit im Intervall)
P*	Höchstprozentsatz der Grundgesamtheit im Intervall
ε	Fehlerspanne des Toleranzintervalls
α*	Wahrscheinlichkeit für Fehlerspanne für das Toleranzintervall
n	Anzahl der Beobachtungen in der Stichprobe

Hahn, G. J. und Meeker, W. Q. (1991), Statistical Intervals: A Guide for Practitioners. John Wiley & Sons, 170.