Methoden und Formeln für Test auf Normalverteilung

Wählen Sie die gewünschte Methode oder Formel aus.

Mittelwert

Ein häufig verwendetes Maß für das Zentrum einer Gruppe von Zahlen. Der Mittelwert wird auch als Durchschnitt bezeichnet. Es handelt sich um die Summe aller Beobachtungen dividiert durch die Anzahl der (nicht fehlenden) Beobachtungen.

Formel

Notation

BegriffBeschreibung
xii-te Beobachtung
NAnzahl der nicht fehlenden Beobachtungen

Standardabweichung (StdAbw)

Die Standardabweichung der Stichprobe bietet ein Maß für die Streubreite der Daten. Sie entspricht der Quadratwurzel der Varianz der Stichprobe.

Formel

Wenn die Spalte x 1, x 2, ..., x N enthält, mit dem Mittelwert , dann ist die Standardabweichung der Stichprobe:

Notation

BegriffBeschreibung
x i i-te Beobachtung
Mittelwert der Beobachtungen
N Anzahl der nicht fehlenden Beobachtungen

N

Minitab zeigt die Anzahl der nicht fehlenden Beobachtungen in einer Stichprobe an.

Anderson-Darling

A2 misst die Fläche zwischen der Anpassungslinie (die auf der ausgewählten Verteilung basiert) und der verteilungsfreien Treppenfunktion (die auf den Diagrammpunkten basiert). Die Statistik ist eine quadrierte Distanz, die in den Randbereichen der Verteilung stärker gewichtet ist. Ein kleiner Anderson-Darling-Wert gibt an, dass die Verteilung besser auf die Daten passt.

Der Anderson-Darling-Normalitätstest ist definiert als:

H0: Die Daten folgen einer Normalverteilung

H1: Die Daten folgen keiner Normalverteilung

Formel

Ein weiteres quantitatives Maß zur Meldung des Normalitätstests ist der p-Wert. Ein kleiner p-Wert gibt an, dass die Nullhypothese falsch ist.

Wenn Sie A 2 kennen, können Sie den p-Wert berechnen. Sei:
Je nach A'2 berechnen Sie p mit den folgenden Gleichungen:
  • Wenn 13 >A'2 0,600 >, dann p = exp(1,2937 - 5,709 *A'2 + 0,0186(A'2)2)
  • Wenn 0,600 >A'2 0,340 >, dann = exp(0,9177 - 4,279 *A'2 – 1,38(A'2)2)
  • Wenn 0,340 >A'2 0,200 >, dann gilt p = 1 – exp(–8,318 + 42,796 *A'2 – 59,938(A'2)2)
  • WennA'2 <0.200 dann p = 1 – exp(–13.436 + 101.14 * A'2 – 223,73(A'2)2)

Notation

BegriffBeschreibung
F(Yi), wobei es sich um die inverse kumulative Verteilungsfunktion der Normalverteilung handelt
Yigeordnete Daten

Ryan-Joiner

Der Ryan-Joiner-Test liefert einen Korrelationskoeffizienten, der die Korrelation zwischen Ihren Daten und den normalen Werten der Ordnungsstatistiken der Daten angibt. Wenn der Korrelationskoeffizient nahe 1 liegt, liegen deine Daten nahe am normalen Wahrscheinlichkeitsdiagramm. Wenn sie kleiner als der entsprechende kritische Wert ist, wirst du die Nullhypothese der Normalität ablehnen.

Formel

Der Korrelationskoeffizient wird wie folgt berechnet:
Die normalen Werte der Ordnungsstatistiken haben folgende Definition:
wobei n die Stichprobengröße und i der Rang der geordneten Beobachtung ist. Weisen Sie den gleichgestellten Beobachtungen den Durchschnitt ihrer Ränge zu. Wenn sich beispielsweise zwei gleich verbundene Beobachtungen in den Positionen 5 und 6 in den geordneten Daten befinden, wird jeder der Rang 5,5 zugeordnet.
Der p-Wert wird mit dem Korrekturfaktor berechnet, der von der Stichprobengröße (n) abhängt. Verwenden Sie den Faktor, der Ihrem Signifikanzniveau entspricht. Zum Beispiel, wenn α = 0,05 gilt, verwenden Sie eine cor05.
Wenn n ≥ 50
Wenn n < 50
Vergleichen Sie dann den Korrelationskoeffizienten mit dem Korrekturfaktor, um den p-Wert zu bestimmen:
  • Wenn Rp > cor10, dann ist p > 0,10.
  • Wenn cor05 < Rpcor10, dann:
  • Wenn cor01 < Rpcor05, dann:
  • Wenn Rpcor01, dann p < 0.01.

Notation

BegriffBeschreibung
Yigeordnete Beobachtungen
biNormalwerte der Ordnungsstatistiken
s2Stichprobenvarianz
nStichprobenumfang
iRang der geordneten Daten

Kolmogorov-Smirnov

Formel

Der Kolmogorov-Smirnov-Test ist definiert als:
  • H0: Die Daten folgen einer Normalverteilung
  • H1: Die Daten folgen keiner Normalverteilung
Die Kolmogorov-Smirnov-Teststatistik ist definiert als:

Um den p-Wert zu bestimmen, verwendet Minitab eine angepasste Statistik (d*), die die Stichprobengröße (n) berücksichtigt.

Vergleichen Sie d* mit den folgenden kritischen Werten, um den p-Wert zu bestimmen:

  • Wenn d* < 0.775, then p > 0,15.
  • Wenn 0,775 ≤ d* < 0.819, then:
  • Wenn 0,819 ≤ d* < 0.895, then:
  • Wenn 0,895 ≤ d* < 0.995, then:
  • Wenn 0,995 ≤ d* < 1.035, then:
  • Wenn d* ≥ 1,035, dann p < 0.01.

Notation

BegriffBeschreibung
D+maxi {i / nZ (i)}
Dmaxi {Z (i) – (i – 1) / n)}
ZF(X(i))
F(x)Wahrscheinlichkeitsfunktion der Normalverteilung
X(i)i-te Ordnung der Statistiken einer Zufallsstichprobe, 1 ≤ i ≤ n
nStichprobenumfang

Diagrammpunkte

Je näher die Punkte an der Anpassungslinie liegen, desto besser ist im Allgemeinen die Anpassung. Minitab bietet zwei Maße für die Güte der Anpassung, mit denen die Anpassung der Verteilung an die Daten beurteilt werden kann.

Formel

Die folgende Tabelle zeigt den Aufbau der mittleren Linie:
Verteilung x-Koordinate y-Koordinate
Normal x Φ–1 norm

Notation

BegriffBeschreibung
Φ–1 norm der für p von der inversen Verteilungsfunktion der Standardnormalverteilung zurückgegebene Wert

Wahrscheinlichkeitsnetze

Die Eingabedaten werden als x-Werte dargestellt. Minitab berechnet die Wahrscheinlichkeit des Ereignisses, ohne eine Verteilung anzunehmen. Die y-Skala in der Grafik ähnelt der y-Skala auf Wahrscheinlichkeitspapier für Normalverteilung, bei der die Wahrscheinlichkeiten als gerade Linie dargestellt werden, als würden die Daten aus einer Normalverteilung stammen.