Interpretieren der wichtigsten Ergebnisse für Histogramm

Führen Sie die folgenden Schritte aus, um ein Histogramm zu interpretieren.

Schritt 1: Auswerten der wesentlichen Merkmale

Untersuchen Sie die Spitzen und die Streubreite der Verteilung. Werten Sie aus, inwiefern sich der Stichprobenumfang auf das Aussehen des Histogramms auswirkt.

Spitzen und Streubreite

Identifizieren Sie die Spitzen, d. h. die höchsten Gruppen von Balken. Die Spitzen stellen die am häufigsten auftretenden Werte dar. Werten Sie die Streubreite der Stichprobe aus, um eine Vorstellung davon zu erhalten, wie stark die Daten variieren.

In diesem Histogramm von Kundenwartezeiten tritt die Spitze der Daten beispielsweise bei ungefähr 6 Minuten auf. Die Streubreite der Daten liegt zwischen etwa 2 bis 12 Minuten.

Untersuchen Sie alle unerwarteten oder unerwünschten Merkmale im Histogramm. Das Histogramm der Kundenwartezeiten zeigte beispielsweise eine größere Streubreite als erwartet. In einer Untersuchung wurde festgestellt, dass die Verzögerungen bei den Kundenwartezeiten auf ein Softwareupdate auf den Computern zurückzuführen war.

Stichprobenumfang (n)

Der Stichprobenumfang kann sich auf das Erscheinungsbild der Grafik auswirken.

Obgleich diese Histogramme anscheinend sehr unterschiedlich sind, wurden jedoch beide auf der Grundlage von zufällig gezogenen Stichproben der Daten aus derselben Grundgesamtheit erstellt.
n = 20
n = 100

Ein Histogramm ist am besten geeignet, wenn der Stichprobenumfang mindestens 20 ist. Wenn der Stichprobenumfang zu klein ist, enthalten die einzelnen Balken des Histogramms u. U. nicht genügend Datenpunkte, um die Verteilung der Daten genau darzustellen. Je größer die Stichprobe, desto stärker ähnelt das Histogramm der Form der Verteilung der Grundgesamtheit. Wenn der Stichprobenumfang weniger als 20 beträgt, erwägen Sie, stattdessen ein Einzelwertdiagramm zu verwenden.

Schritt 2: Suchen nach Anzeichen von nicht normalverteilten oder ungewöhnlichen Daten

Schiefe Daten und multimodale Daten weisen darauf hin, dass die Daten möglicherweise nicht normalverteilt sind. Ausreißer können andere Bedingungen in den Daten anzeigen.

Schiefe Daten

Wenn die Daten schief sind, liegen die meisten Datenwerte am oberen oder unteren Rand der Grafik. Schiefe weist darauf hin, dass die Daten möglicherweise nicht normalverteilt sind.

Diese Histogramme veranschaulichen schiefe Daten. Das Histogramm mit rechtsschiefen Daten zeigt Wartezeiten. Die meisten Wartezeiten sind relativ kurz, und nur wenige Wartezeiten sind lang. Das Histogramm mit linksschiefen Daten zeigt Ausfallzeiten. Nur wenige Elemente fallen sofort aus, während viel mehr Elemente zu späteren Zeitpunkten ausfallen.

Rechtsschief
Linksschief

Wenn Ihnen bekannt ist, dass die Daten nicht naturgemäß schief sind, untersuchen Sie die möglichen Ursachen. Wenn Sie erheblich schiefe Daten analysieren möchten, lesen Sie den Artikel mit Überlegungen zu Daten für die Analyse, um sicherzustellen, dass Sie nicht normalverteilte Daten verwenden können.

Ausreißer

Ausreißer, d. h. Datenwerte, die weit entfernt von den anderen Datenwerten liegen, können sich stark auf Ihre Ergebnisse auswirken. Häufig können Ausreißer am einfachsten in einem Boxplot identifiziert werden.

In einem Histogramm weisen isolierte Balken an den Enden auf Ausreißer hin.

Versuchen Sie, die Ursache von Ausreißern zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse.

Multimodale Daten

Multimodale Daten weisen mehrere Spitzen auf. (Eine Spitze stellt den Modus eines Datensatzes dar.) Multimodale Daten treten in der Regel auf, wenn die Daten aus mehreren Prozessen oder unter mehreren Bedingungen erfasst wurden, z. B. bei unterschiedlichen Temperaturen.

Diese Histogramme stellen beispielsweise Grafiken der gleichen Daten dar. Das einfache Histogramm weist zwei Spitzen auf, die Bedeutung der Spitzen ist jedoch unklar. Im Histogramm mit Gruppen wird veranschaulicht, dass die Spitzen zwei Gruppen entsprechen.

Einfach
Mit Gruppen

Wenn Sie über zusätzliche Informationen verfügen, die es Ihnen ermöglichen, die Beobachtungen in Gruppen zu gliedern, können Sie anhand dieser Informationen eine Gruppierungsvariable anlegen. Dann können Sie die Grafik mit den Gruppen erstellen, um zu ermitteln, ob die Gruppierungsvariable die Spitzen in den Daten erklärt.

Tipp

Um eine Gruppierungsvariablen zu einer vorhandenen Grafik hinzuzufügen, doppelklicken Sie auf eine Datendarstellung in der Grafik, und klicken Sie anschließend auf die Registerkarte Gruppen.

Schritt 3: Auswerten der Anpassung einer Verteilung

Wenn das Histogramm eine angepasste Verteilungslinie aufweist, untersuchen Sie, wie eng die Höhen der Balken der Form der Linie folgen. Wenn die Balken nahe der angepassten Verteilungslinie liegen, ist die Verteilung gut an die Daten angepasst.

Hinweis

Informationen zum Angeben anderer Verteilungen und Parameter finden Sie unter Angepasste Verteilungslinien.

Gute Anpassung
Schlechte Anpassung

Sie können die Verteilungsanpassung genauer messen, indem Sie die Anpassung mit einem Wahrscheinlichkeitsnetz auf statistische Signifikanz prüfen.

Schritt 4: Auswerten und Vergleichen von Gruppen

Wenn das Histogramm Gruppen aufweist, beurteilen und vergleichen Sie Lage und Streubreite der Gruppen.

Lagen

Suchen Sie nach Differenzen zwischen den Lagen der Gruppen.

Diese Histogramme stellen beispielsweise die Fertigstellungszeit für drei Versionen einer Kreditkartenanwendung dar. Die Lage jeder Version der Kreditkartenanwendung ist an einer anderen Stelle. Die Differenzen der Lagen weisen darauf hin, dass sich die mittleren Fertigstellungszeiten unterscheiden.
Überlagerte Histogramme
Histogramme mit Feldern
Um festzustellen, ob eine Differenz zwischen Mittelwerten statistisch signifikant ist, führen Sie einen der folgenden Vorgänge aus:

Streubreiten

Suchen Sie nach Differenzen zwischen den Streubreiten der Gruppen.

In diesen Histogrammen werden beispielsweise die Gewichte von Gläsern veranschaulicht, die von drei verschiedenen Maschinen befüllt wurden. Obwohl die Histogramme annähernd die gleiche Lage aufweisen, sind einige Histogramme breiter und stärker gestreut. Die größere Streubreite weist darauf hin, dass die Gläser von den betreffenden Maschinen weniger einheitlich befüllt werden.
Überlagerte Histogramme
Histogramme mit Feldern
Um festzustellen, ob eine Differenz zwischen Streubreiten (Varianzen) statistisch signifikant ist, führen Sie einen der folgenden Vorgänge aus: