Methoden für Identifikation der Verteilung

Maximum-Likelihood-Schätzwerte

Maximum-Likelihood-Schätzwerte der Verteilungsparameter werden durch Maximieren der Likelihood-Funktion in Bezug auf die Parameter berechnet. Mit der Likelihood-Funktion einer Verteilung wird die Wahrscheinlichkeit für einen bestimmten Datensatz geschätzt, mit der diese Daten unter der betreffenden Verteilung generiert werden.

Mit dem Newton-Raphson-Algorithmus werden Maximum-Likelihood-Schätzwerte der Parameter berechnet, die die Verteilung definieren. Der Newton-Raphson-Algorithmus ist eine rekursive Methode zum Berechnen des Maximums einer Funktion. 1 Die Perzentile werden dann auf der Grundlage der Verteilung berechnet.

Hinweis

Minitab verwendet die Maximum-Likelihood-Methode zum Berechnen der Parameterschätzwerte für alle Verteilungen mit Ausnahme der Normalverteilung und der lognormalen Verteilung. Für die Normalverteilung und die lognormale Verteilung berechnet Minitab erwartungstreue Parameterschätzwerte.

Test auf Güte der Anpassung

Minitab verwendet für den Test auf Güte der Anpassung Anderson-Darling-Statistiken.

Sei z = f(x), wobei f(x) die kumulative Verteilungsfunktion ist. Angenommen, eine Stichprobe x1, .., xn ergibt die Werte z(i) = f(xi), i=1,.., n. Anschließend wird z(i) in aufsteigender Reihenfolge angeordnet, so dass z(1) < z(2) <...<z(n). Die Anderson-Darling-Statistik (A2) wird dann wie folgt berechnet:

  • A2 = –n – (1/n) Σi[(2i – 1) log z(i) + (2n + 1 – 2i) log (1 – z(i))]

Die modifizierte Anderson-Darling-Statistik für den Test auf Güte der Anpassung wird für jede Verteilung berechnet. Die p-Werte beruhen auf den Tabellen 4.8−4.22 in D'Agostino und Stephens2 Wenn in der Tabelle kein genauer p-Wert gefunden wird, berechnet Minitab den p-Wert durch Interpolation unter Verwendung der Spannweite des p-Werts.

Hinweis

p-Werte für den Anderson-Darling-Test sind mit Ausnahme der Weibull-Verteilung nicht für Verteilungen mit 3 Parametern verfügbar.

Likelihood-Quotienten-Test

Beim Likelihood-Quotienten-Test wird die Anpassung einer größeren Verteilungsfamilie mit einer Teilmenge derselben Familie verglichen, und es wird ermittelt, ob bei der größeren Verteilung eine signifikante Verbesserung der Anpassung vorliegt. Für eine Exponentialverteilung mit 2 Parametern vergleicht der Likelihood-Quotienten-Test beispielsweise die Anpassung der Familie von Exponentialverteilungen mit 2 Parametern mit der Anpassung der Familie von Exponentialverteilungen mit 1 Parameter (eine Teilmenge, deren zweiter Parameter 0 ist). Wenn eine Exponentialverteilung mit 2 Parametern die Anpassung signifikant verbessert, ist der p-Wert für die Statistik des Likelihood-Quotienten-Tests sehr klein.

Die Statistik für den Likelihood-Quotienten-Test wird wie folgt berechnet.

Seien A der Maximum-Likelihood-Schätzwert (MLE) des Parametervektors für die größere Verteilungsfamilie (z. B. die Verteilungsfamilie mit 3 Parametern) und L(A) die Log-Likelihood. Seien B der MLE des Parametervektors für die entsprechende kleinere Verteilungsfamilie (z. B. die entsprechende Verteilungsfamilie mit 2 Parametern) und L(B) die Log-Likelihood.

Statistik des Likelihood-Quotienten-Tests = 2 * L(A) 2 * L(B).

Unter der Nullhypothese bietet die kleiner Verteilungsfamilie eine gute Anpassung an die Daten. Die Statistik des Likelihood-Quotienten-Tests weist eine Chi-Quadrat-Verteilung mit Freiheitsgraden = Dimension von Vektor (A) – Dimension von Vektor (B) auf.

1 W. Murray, Ed. (1972). Numerical Methods for Unconstrained Optimization. Academic Press.
2 M. A. Stephens (1986). Kapitel 4: Tests based on EDF statistics. Goodness-of-Fit Techniques, Hrsg. R. B. D'Agostino und M. A. Stephens. Marcel Dekker, Inc. S. 97-193.