Interpretieren der wichtigsten Ergebnisse für Boxplot

Führen Sie die folgenden Schritte aus, um ein Boxplot zu interpretieren.

Schritt 1: Auswerten der wesentlichen Merkmale

Untersuchen Sie die Lage und die Streubreite der Verteilung. Werten Sie aus, inwiefern sich der Stichprobenumfang auf das Aussehen des Boxplots auswirkt.

Lage und Streubreite

Untersuchen Sie die folgenden Elemente, um mehr über die Lage und Streubreite der Stichprobendaten zu erfahren.
Median
Der Median wird durch die Linie in der Box dargestellt. Der Median ist ein gängiges Maß für die Lage der Daten. Die eine Hälfte der Beobachtungen ist kleiner oder gleich dem Wert, die andere Hälfte der Beobachtungen ist größer oder gleich dem Wert.
Box für Interquartilbereich
Die Box für den Interquartilbereich stellt die mittleren 50 % der Daten dar. Sie gibt den Abstand zwischen dem ersten und dem dritten Quartil (Q3–Q1) an.
Whisker
Die Whisker gehen von beiden Seiten der Box aus. Sie stellen die Bereiche für die unteren 25 % und die oberen 25 % der Datenwerte ausschließlich der Ausreißer dar.

Zeigen Sie mit dem Mauszeiger auf das Boxplot, um eine QuickInfo mit diesen Statistiken einzublenden. Dieses Boxplot für den Ruhepuls zeigt beispielsweise, dass der Median-Ruhepuls gleich 71 ist. Die meisten Probanden haben einen Ruhepuls zwischen 64 und 80, bei einigen Probanden wurden jedoch niedrige Ruhepulsraten bis hinab zu 48 und hohe Ruhepulsraten bis zu 100 gemessen.

Untersuchen Sie alle unerwarteten oder unerwünschten Merkmale im Boxplot. Ein Boxplot kann z. B. veranschaulichen, dass die Median-Länge von Brettern viel kürzer als die Soll-Länge von 8 Fuß ist.

Hinweis

Da die Quartile des Boxplots berechnete Werte sind, entsprechen sie möglicherweise nicht tatsächlichen Beobachtungen im Datensatz. Weitere Informationen zum Interpretieren der Quartile finden Sie unter Was sind Quartile?. Spezifische Informationen zur Berechnung der Quartile finden Sie unter Methoden und Formeln für die grafische Zusammenfassung.

Stichprobenumfang (n)

Der Stichprobenumfang kann sich auf das Erscheinungsbild der Grafik auswirken.

Obgleich diese Boxplots anscheinend sehr unterschiedlich sind, wurden jedoch beide auf Grundlage von zufällig gezogenen Stichproben der Daten aus derselben Grundgesamtheit erstellt.
n = 15
n = 500

Ein Boxplot ist am besten geeignet, wenn der Stichprobenumfang mindestens 20 ist. Wenn der Stichprobenumfang zu klein ist, sind die im Boxplot angezeigten Quartile und Ausreißer möglicherweise nicht aussagekräftig. Wenn der Stichprobenumfang weniger als 20 beträgt, erwägen Sie, stattdessen ein Einzelwertdiagramm zu verwenden.

Schritt 2: Suchen nach Anzeichen von nicht normalverteilten oder ungewöhnlichen Daten

Schiefe Daten weisen darauf hin, dass die Daten möglicherweise nicht normalverteilt sind. Ausreißer können andere Bedingungen in den Daten anzeigen.

Schiefe Daten

Wenn die Daten schief sind, liegen die meisten Datenwerte am oberen oder unteren Rand der Grafik. Schiefe weist darauf hin, dass die Daten möglicherweise nicht normalverteilt sind.

Diese Boxplots veranschaulichen schiefe Daten. Das Boxplot mit rechtsschiefen Daten zeigt Wartezeiten. Die meisten Wartezeiten sind relativ kurz, und nur wenige Wartezeiten sind lang. Das Boxplot mit linksschiefen Daten zeigt Ausfallzeitdaten. Nur wenige Elemente fallen sofort aus, während viel mehr Elemente zu späteren Zeitpunkten ausfallen.

Rechtsschief
Linksschief

Wenn Ihnen bekannt ist, dass die Daten nicht naturgemäß schief sind, untersuchen Sie die möglichen Ursachen. Wenn Sie erheblich schiefe Daten analysieren möchten, lesen Sie den Artikel mit Überlegungen zu Daten für die Analyse, um sicherzustellen, dass Sie nicht normalverteilte Daten verwenden können.

Ausreißer

Ausreißer, d. h. Datenwerte, die weit entfernt von den anderen Datenwerten liegen, können sich stark auf Ihre Ergebnisse auswirken. Häufig können Ausreißer am einfachsten in einem Boxplot identifiziert werden.

In einem Boxplot werden Ausreißer mit Sternchen (*) gekennzeichnet.
Tipp

Zeigen Sie mit dem Mauszeiger auf den Ausreißer, um den Datenpunkt zu identifizieren.

Versuchen Sie, die Ursache von Ausreißern zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse.

Schritt 3: Auswerten und Vergleichen von Gruppen

Wenn das Boxplot Gruppen aufweist, beurteilen und vergleichen Sie Lage und Streubreite der Gruppen.

Lagen

Suchen Sie nach Differenzen zwischen den Lagen der Gruppen.

In diesem Boxplot wird beispielsweise die Stärke von Draht veranschaulicht, der von vier verschiedenen Lieferanten gefertigt wird. Die Median-Stärken einiger Gruppen scheinen sich zu unterscheiden.

Streubreiten

Suchen Sie nach Differenzen zwischen den Streubreiten der Gruppen.

In diesem Boxplot werden beispielsweise die Füllgewichte von Frühstücksflockenpackungen von vier verschiedenen Produktionslinien veranschaulicht. Die Median-Gewichte der Gruppen von Frühstücksflockenpackungen ähneln einander, die Gewichte einiger Gruppen schwanken jedoch stärker als die anderer Gruppen.
Um festzustellen, ob eine Differenz zwischen Streubreiten (Varianzen) statistisch signifikant ist, führen Sie einen der folgenden Vorgänge aus: