Methoden und Formeln für Test auf Normalverteilung

Mittelwert

Ein häufig verwendetes Maß für das Zentrum einer Gruppe von Zahlen. Der Mittelwert wird auch als Durchschnitt bezeichnet. Es handelt sich um die Summe aller Beobachtungen dividiert durch die Anzahl der (nicht fehlenden) Beobachtungen.

Formel

Notation

Begriff	Beschreibung
x_i	i-te Beobachtung
N	Anzahl der nicht fehlenden Beobachtungen

Standardabweichung (StdAbw)

Die Standardabweichung der Stichprobe bietet ein Maß für die Streubreite der Daten. Sie entspricht der Quadratwurzel der Varianz der Stichprobe.

Formel

Wenn die Spalte x ₁, x ₂, ..., x _N enthält, mit dem Mittelwert

, dann ist die Standardabweichung der Stichprobe:

Notation

Begriff	Beschreibung
x _i	i-te Beobachtung
	Mittelwert der Beobachtungen
N	Anzahl der nicht fehlenden Beobachtungen

N

Minitab zeigt die Anzahl der nicht fehlenden Beobachtungen in einer Stichprobe an.

Anderson-Darling

A² misst die Fläche zwischen der Anpassungslinie (die auf der ausgewählten Verteilung basiert) und der verteilungsfreien Treppenfunktion (die auf den Diagrammpunkten basiert). Die Statistik ist eine quadrierte Distanz, die in den Randbereichen der Verteilung stärker gewichtet ist. Ein kleiner Anderson-Darling-Wert gibt an, dass die Verteilung besser auf die Daten passt.

Der Anderson-Darling-Normalitätstest ist definiert als:

H₀: Die Daten folgen einer Normalverteilung

H₁: Die Daten folgen keiner Normalverteilung

Formel

Ein weiteres quantitatives Maß zur Meldung des Normalitätstests ist der p-Wert. Ein kleiner p-Wert gibt an, dass die Nullhypothese falsch ist.

Wenn Sie A ² kennen, können Sie den p-Wert berechnen. Sei:

Je nach A'² berechnen Sie p mit den folgenden Gleichungen:

Wenn 13 >^A'2 0,600 >, dann p = exp(1,2937 - 5,709 *^A'2 + 0,0186(^A'2)²)
Wenn 0,600 >^A'2 0,340 >, dann = exp(0,9177 - 4,279 *^A'2 – 1,38(^A'2)²)
Wenn 0,340 >^A'2 0,200 >, dann gilt p = 1 – exp(–8,318 + 42,796 *^A'2 – 59,938(^A'2)²)
Wenn^A'2 <0.200 dann p = 1 – exp(–13.436 + 101.14 * A'² – 223,73(^A'2)²)

Notation

Begriff	Beschreibung
F(Y_i)	, wobei es sich um die inverse kumulative Verteilungsfunktion der Normalverteilung handelt
Y_i	geordnete Daten

Ryan-Joiner

Der Ryan-Joiner-Test liefert einen Korrelationskoeffizienten, der die Korrelation zwischen Ihren Daten und den normalen Werten der Ordnungsstatistiken der Daten angibt. Wenn der Korrelationskoeffizient nahe 1 liegt, liegen deine Daten nahe am normalen Wahrscheinlichkeitsdiagramm. Wenn sie kleiner als der entsprechende kritische Wert ist, wirst du die Nullhypothese der Normalität ablehnen.

Formel

Der Korrelationskoeffizient wird wie folgt berechnet:

Die normalen Werte der Ordnungsstatistiken haben folgende Definition:

wobei n die Stichprobengröße und i der Rang der geordneten Beobachtung ist. Weisen Sie den gleichgestellten Beobachtungen den Durchschnitt ihrer Ränge zu. Wenn sich beispielsweise zwei gleich verbundene Beobachtungen in den Positionen 5 und 6 in den geordneten Daten befinden, wird jeder der Rang 5,5 zugeordnet.

Der p-Wert wird mit dem Korrekturfaktor berechnet, der von der Stichprobengröße (n) abhängt. Verwenden Sie den Faktor, der Ihrem Signifikanzniveau entspricht. Zum Beispiel, wenn α = 0,05 gilt, verwenden Sie eine cor05.

Wenn n ≥ 50

Wenn n < 50

Vergleichen Sie dann den Korrelationskoeffizienten mit dem Korrekturfaktor, um den p-Wert zu bestimmen:

Wenn R_p > cor10, dann ist p > 0,10.
Wenn cor05 < R_p ≤ cor10, dann:
Wenn cor01 < R_p ≤ cor05, dann:
Wenn R_p ≤ cor01, dann p < 0.01.

Notation

Begriff	Beschreibung
Y_i	geordnete Beobachtungen
b_i	Normalwerte der Ordnungsstatistiken
s²	Stichprobenvarianz
n	Stichprobenumfang
i	Rang der geordneten Daten

Kolmogorov-Smirnov

Formel

Der Kolmogorov-Smirnov-Test ist definiert als:

H₀: Die Daten folgen einer Normalverteilung
H₁: Die Daten folgen keiner Normalverteilung

Die Kolmogorov-Smirnov-Teststatistik ist definiert als:

Um den p-Wert zu bestimmen, verwendet Minitab eine angepasste Statistik (d^*), die die Stichprobengröße (n) berücksichtigt.

Vergleichen Sie d^* mit den folgenden kritischen Werten, um den p-Wert zu bestimmen:

Wenn d^* < 0.775, then p > 0,15.
Wenn 0,775 ≤ d^* < 0.819, then:
Wenn 0,819 ≤ d^* < 0.895, then:
Wenn 0,895 ≤ d^* < 0.995, then:
Wenn 0,995 ≤ d^* < 1.035, then:
Wenn d^* ≥ 1,035, dann p < 0.01.

Notation

Begriff	Beschreibung
D⁺	max_i {i / n – Z _(i)}
D^–	max_i {Z _(i) – (i – 1) / n)}
Z	F(X_(i))
F(x)	Wahrscheinlichkeitsfunktion der Normalverteilung
X_(i)	i-te Ordnung der Statistiken einer Zufallsstichprobe, 1 ≤ i ≤ n
n	Stichprobenumfang

Diagrammpunkte

Je näher die Punkte an der Anpassungslinie liegen, desto besser ist im Allgemeinen die Anpassung. Minitab bietet zwei Maße für die Güte der Anpassung, mit denen die Anpassung der Verteilung an die Daten beurteilt werden kann.

Formel

Die folgende Tabelle zeigt den Aufbau der mittleren Linie:

Verteilung	x-Koordinate	y-Koordinate
Normal	x	Φ^–1 _norm

Notation

Begriff	Beschreibung
Φ^–1 _norm	der für p von der inversen Verteilungsfunktion der Standardnormalverteilung zurückgegebene Wert

Wahrscheinlichkeitsnetze

Die Eingabedaten werden als x-Werte dargestellt. Minitab berechnet die Wahrscheinlichkeit des Ereignisses, ohne eine Verteilung anzunehmen. Die y-Skala in der Grafik ähnelt der y-Skala auf Wahrscheinlichkeitspapier für Normalverteilung, bei der die Wahrscheinlichkeiten als gerade Linie dargestellt werden, als würden die Daten aus einer Normalverteilung stammen.

Methoden und Formeln für Test auf Normalverteilung

In diesem Thema

Mittelwert

Formel

Notation

Standardabweichung (StdAbw)

Formel

Notation

N

Anderson-Darling

Formel

Notation

Ryan-Joiner

Formel

Notation

Kolmogorov-Smirnov

Formel

Notation

Diagrammpunkte

Formel

Notation

Wahrscheinlichkeitsnetze