Methoden und Formeln für Grafische Zusammenfassung

Wählen Sie die gewünschte Methode oder Formel aus.

In diesem Thema

Anderson-Darling-Statistik (A²)
p-Wert für den Anderson-Darling-Test auf Normalverteilung
N nicht fehlend (N)
Standardabweichung (StdAbw)
Varianz
Schiefe
Kurtosis
Mittelwert

Minimum
Maximum
1. Quartil (Q1)
Median
3. Quartil (Q3)
Konfidenzintervall für den Mittelwert
Konfidenzintervall für den Median
Konfidenzintervall für die Standardabweichung

Anderson-Darling-Statistik (A²)

A² misst die Fläche zwischen der Anpassungslinie (die auf der ausgewählten Verteilung basiert) und der verteilungsfreien Treppenfunktion (die auf den Diagrammpunkten basiert). Die Statistik ist eine quadrierte Distanz, die in den Randbereichen der Verteilung stärker gewichtet ist. Ein kleiner Anderson-Darling-Wert gibt an, dass die Verteilung besser auf die Daten passt.

Der Test auf Normalverteilung nach Anderson-Darling ist wie folgt definiert:

H₀: Die Daten folgen einer Normalverteilung

H₁: Die Daten folgen keiner Normalverteilung

Formel

Notation

Begriff	Beschreibung
F(Y_i)	, wobei es sich um die inverse kumulative Verteilungsfunktion der Normalverteilung handelt
Y_i	geordnete Daten

p-Wert für den Anderson-Darling-Test auf Normalverteilung

Der p-Wert ist ein quantitatives Maß, mit dem das Ergebnis des Anderson-Darling-Tests auf Normalverteilung angegeben wird. Ein kleiner p-Wert gibt an, dass die Nullhypothese falsch ist.

Wenn Sie A ² kennen, können Sie den p-Wert berechnen.

Sei

Je nach A'² berechnen Sie p mit den folgenden Gleichungen:

Wenn 13 > A'² > 0,600, dann p = exp(1,2937 - 5,709 * A'² + 0,0186(A'²)²)
Wenn 0,600 > A'² > 0,340, dann p = exp(0,9177 - 4,279 * A'² – 1,38(A'²)²)
Wenn 0,340 > A'² > 0,200, dann p = 1 – exp(–8,318 + 42,796 * A'² – 59,938(A'²)²)
Wenn A'² < 0,200, dann p = 1 – exp(–13,436 + 101,14 * A'² – 223,73(A'²)²)

N nicht fehlend (N)

Die Anzahl der nicht fehlenden Werte in der Stichprobe.

Standardabweichung (StdAbw)

Die Standardabweichung der Stichprobe bietet ein Maß für die Streubreite der Daten. Sie entspricht der Quadratwurzel der Varianz der Stichprobe.

Formel

Wenn die Spalte x ₁, x ₂, ..., x _N enthält, mit dem Mittelwert

, dann ist die Standardabweichung der Stichprobe:

Notation

Begriff	Beschreibung
x _i	i-te Beobachtung
	Mittelwert der Beobachtungen
N	Anzahl der nicht fehlenden Beobachtungen

Varianz

Die Varianz ist ein Maß der Streuung der Daten um ihren Mittelpunkt. Die Varianz ist gleich dem Quadrat der Standardabweichung.

Formel

Notation

Begriff	Beschreibung
x_i	i-te Beobachtung
	Mittelwert der Beobachtungen
N	Anzahl der nicht fehlenden Beobachtungen

Schiefe

Schiefe ist ein Maß für Asymmetrie. Ein negativer Wert gibt eine Schiefe nach links an, und ein positiver Wert gibt eine Schiefe nach rechts an. Ein Nullwert deutet nicht unbedingt auf Symmetrie hin.

Formel

Notation

Begriff	Beschreibung
x_i	i-te Beobachtung
	Mittelwert der Beobachtungen
N	Anzahl der nicht fehlenden Beobachtungen
s	Standardabweichung der Stichprobe

Kurtosis

Die Kurtosis ist ein Maß dafür, wie weit eine Verteilung von der Normalverteilung abweicht. Ein positiver Wert deutet in der Regel darauf hin, dass sich die Verteilung durch eine steilere Wölbung als die Normalverteilung auszeichnet. Ein negativer Wert deutet darauf hin, dass die Verteilung eine flachere Wölbung als die Normalverteilung aufweist.

Formel

Notation

Begriff	Beschreibung
x_i	i-te Beobachtung
	Mittelwert der Beobachtungen
N	Anzahl der nicht fehlenden Beobachtungen
s	Standardabweichung der Stichprobe

Mittelwert

Ein häufig verwendetes Maß für das Zentrum einer Gruppe von Zahlen. Der Mittelwert wird auch als Durchschnitt bezeichnet. Es handelt sich um die Summe aller Beobachtungen dividiert durch die Anzahl der (nicht fehlenden) Beobachtungen.

Formel

Notation

Begriff	Beschreibung
x_i	i-te Beobachtung
N	Anzahl der nicht fehlenden Beobachtungen

Minimum

Der kleinste Wert im Datensatz.

Maximum

Der größte Wert in Ihrem Datensatz.

1. Quartil (Q1)

25 % Ihrer Stichprobenbeobachtungen sind kleiner oder gleich dem Wert des 1. Quartils. Daher wird das 1. Quartil auch als das 25. Perzentil bezeichnet.

Formel

Notation

Begriff	Beschreibung
y	auf ganze Zahl abgeschnittener Wert von w
w
z	abgeschnittener Nachkommaanteil von w
x_j	j-te Beobachtung in der Liste von Stichprobendaten, von der kleinsten zur größten geordnet

Hinweis

Wenn w eine ganze Zahl ist: y = w, z = 0 und Q1 = x_y.

Median

Der Stichproben-Median liegt in der Mitte der Daten: Mindestens die Hälfte der Beobachtungen sind kleiner oder gleich und mindestens die Hälfte sind größer oder gleich dem Stichproben-Median.

Angenommen, eine Spalte enthält N Werte. Um den Median zu berechnen, ordnen Sie die Datenwerte zunächst vom kleinsten zum größten an. Wenn N eine ungerade Zahl ist, handelt es sich bei dem Stichproben-Median um den Wert in der Mitte. Wenn N eine gerade Zahl ist, handelt es sich bei dem Stichproben-Median um den Durchschnitt der beiden mittleren Werte.

Beispiel: Wenn N = 5 und die Daten x₁, x₂, x₃, x₄ und x₅ vorliegen, ist der Median = x₃.

Wenn N = 6 und die geordneten Daten x₁, x₂, x₃, x₄, x₅ und x₆ vorliegen:

wobei x₃ und x₄ die dritte und vierte Beobachtung sind.

3. Quartil (Q3)

75 % Ihrer Stichprobenbeobachtungen sind kleiner oder gleich dem Wert des dritten Quartils. Daher wird das dritte Quartil auch als das 75. Perzentil bezeichnet.

Formel

Notation

Begriff	Beschreibung
y	auf ganze Zahl abgeschnittener Wert von w
w
z	abgeschnittener Nachkommaanteil von w
x_j	j-te Beobachtung in der Liste von Stichprobendaten, von der kleinsten zur größten geordnet

Hinweis

Wenn w eine ganze Zahl ist: y = w, z = 0 und Q3 = x_y.

Konfidenzintervall für den Mittelwert

Formel

Notation

Begriff	Beschreibung
	Mittelwert
s	Standardabweichung der Stichprobe
N	Anzahl nicht fehlender Beobachtungen
t_{N, α}	Inverse kumulative Wahrscheinlichkeit einer t-Verteilung mit N – 1 Freiheitsgraden bei 1 – α/2; α = 1 – Konfidenzniveau/100

Konfidenzintervall für den Median

Minitab verwendet die nichtlineare Interpolation zur Berechnung des Konfidenzintervalls für den tatsächlichen Median ¹. Diese Methode ist eine sehr gute Approximation für eine Vielzahl von symmetrischen Verteilungen, darunter die Normalverteilung, die Cauchy-Verteilung und die Gleichverteilung. Beispiele für nichtsymmetrische Verteilungen zeigen angemessene Ergebnisse, die immer wesentlich genauer sind als bei der linearen Interpolation.

Konfidenzintervall für die Standardabweichung

Minitab berechnet ein (1 – α)100%-Konfidenzintervall für die Standardabweichung der Grundgesamtheit σ. Das Konfidenzintervall ist sehr empfindlich gegenüber der Annahme, dass die Daten normalverteilt sind. Selbst geringfügige Abweichungen von der Normalverteilung können zu einem irreführenden Konfidenzintervall führen.

Formel

Das Konfidenzintervall reicht von:

Notation

Begriff	Beschreibung
s	Standardabweichung
N	Anzahl nicht fehlender Beobachtungen
χ²_{N, α}	inverse kumulative Wahrscheinlichkeit einer χ²-Verteilung mit N Freiheitsgraden bei 1 – α / 2; α = 1 – Konfidenzniveau / 100

¹ Hettmansperger, T. P. und Sheather, S. J. (1986). „Confidence Intervals Based on Interpolated Order Statistics“, Statistics and Probability Letters, 4, 75-79.

Methoden und Formeln für Grafische Zusammenfassung

In diesem Thema

Anderson-Darling-Statistik (A2)

Formel

Notation

p-Wert für den Anderson-Darling-Test auf Normalverteilung

N nicht fehlend (N)

Standardabweichung (StdAbw)

Formel

Notation

Varianz

Formel

Notation

Schiefe

Formel

Notation

Kurtosis

Formel

Notation

Mittelwert

Formel

Notation

Minimum

Maximum

1. Quartil (Q1)

Formel

Notation

Hinweis

Median

3. Quartil (Q3)

Formel

Notation

Hinweis

Konfidenzintervall für den Mittelwert

Formel

Notation

Konfidenzintervall für den Median

Konfidenzintervall für die Standardabweichung

Formel

Notation

Anderson-Darling-Statistik (A²)