Untersuchen Sie die Lage und die Streubreite der Verteilung. Werten Sie aus, inwiefern sich der Stichprobenumfang auf das Aussehen des Stamm- und Blattdiagramms auswirkt.
Für jede Zeile stellt die Zahl im „Stamm“ (der mittleren Spalte) die erste Ziffer (bzw. die ersten Ziffern) der Stichprobenwerte dar. Die „Blatteinheit“ oben im Diagramm gibt an, welche Dezimalstelle die Blattwerte darstellen.
Untersuchen Sie alle unerwarteten oder unerwünschten Merkmale. Das Stamm-und-Blattdiagramm der Kundenwartezeiten zeigte beispielsweise höhere Werte und eine größere Streubreite als erwartet. In einer Untersuchung wurde festgestellt, dass die Instabilität und Verzögerungen auf außergewöhnlich hohen Internetdatenverkehr zurückzuführen waren.
Der Stichprobenumfang kann sich auf das Erscheinungsbild der Grafik auswirken.
Der Stichprobenumfang wird oben im Stamm- und Blattdiagramm angezeigt. Im vorausgegangenen Beispiel beträgt der Stichprobenumfang 50 (N = 50).
Da in einem Stamm- und Blattdiagramm jeder Datenwert dargestellt wird, eignet es sich insbesondere bei Stichprobenumfängen kleiner als ungefähr 50. Bei einem Stichprobenumfang größer als 50 liegen die Datenpunkte im Diagramm möglicherweise zu weit auseinander, und die Verteilung kann nur schwer beurteilt werden. Wenn mehr als 50 Datenpunkte vorliegen, erwägen Sie, ein Boxplot oder ein Histogramm zu verwenden.
Schiefe Daten und multimodale Daten weisen darauf hin, dass die Daten möglicherweise nicht normalverteilt sind. Ausreißer können auf andere Bedingungen in den Daten hinweisen.
Ermitteln Sie, ob Ihre Daten schief sind. Wenn die Daten schief sind, liegen die meisten Datenwerte am oberen oder unteren Rand der Grafik. Schiefe weist darauf hin, dass die Daten möglicherweise nicht normalverteilt sind. Häufig lässt sich die Schiefe am einfachsten mit einem Histogramm oder einem Boxplot erkennen.
Diese Stamm- und Blattdiagramme veranschaulichen schiefe Daten. Das Stamm- und Blattdiagramm mit rechtsschiefen Daten zeigt Wartezeiten. Die meisten Wartezeiten sind relativ kurz, und nur wenige Wartezeiten sind lang. Das Stamm- und Blattdiagramm mit linksschiefen Daten zeigt Ausfallzeiten. Nur wenige Elemente fallen sofort aus, während viel mehr Elemente zu späteren Zeitpunkten ausfallen.
Wenn Ihnen bekannt ist, dass die Daten nicht naturgemäß schief sind, untersuchen Sie die möglichen Ursachen. Wenn Sie erheblich schiefe Daten analysieren möchten, lesen Sie den Artikel mit Überlegungen zu Daten für die Analyse, um sicherzustellen, dass Sie nicht normalverteilte Daten verwenden können.
Ausreißer, d. h. Datenwerte, die weit entfernt von den anderen Datenwerten liegen, können sich stark auf Ihre Ergebnisse auswirken.
Versuchen Sie, die Ursache für die Ausreißer zu identifizieren. Korrigieren Sie sämtliche Dateneingabefehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse.
Multimodale Daten weisen mehrere Spitzen auf. (Eine Spitze stellt den Modus eines Datensatzes dar.) Multimodale Daten treten in der Regel auf, wenn die Daten aus mehreren Prozessen oder unter mehreren Bedingungen erfasst wurden, z. B. bei unterschiedlichen Temperaturen.
Diese Stamm- und Blattdiagramme stellen beispielsweise Grafiken der gleichen Daten dar. Das einfache Stamm- und Blattdiagramm weist zwei Cluster von Punkten auf, die Bedeutung der Cluster ist jedoch unklar. Im Stamm- und Blattdiagramm mit Gruppen wird veranschaulicht, dass die Cluster zwei Gruppen entsprechen.
Wenn Sie über zusätzliche Informationen verfügen, die es Ihnen ermöglichen, die Beobachtungen in Gruppen zu gliedern, können Sie anhand dieser Informationen eine Gruppierungsvariable anlegen. Dann können Sie die Grafik mit den Gruppen erstellen, um zu ermitteln, ob die Gruppierungsvariable die Spitzen in den Daten erklärt.