Interpretieren der wichtigsten Ergebnisse für Deskriptive Statistik anzeigen

Führen Sie die folgenden Schritte aus, um die Anzeige deskriptiver Statistiken zu interpretieren. Zu den wichtigsten Ausgaben zählen N, der Mittelwert, der Median, die Standardabweichung sowie mehrere Grafiken.

Schritt 1: Stichprobenumfang beschreiben

Verwenden Sie N, um die Anzahl der Beobachtungen in der Stichprobe zu ermitteln. Minitab schließt fehlende Werte aus dieser Zählung aus.

Sie sollten eine mittelgroße bis große Stichprobe von Daten erfassen. Stichproben mit mindestens 20 Beobachtungen sind häufig angemessen, um die Verteilung der Daten darzustellen. Um die Verteilung mit einem Histogramm besser darzustellen zu können, empfehlen einige Praktiker jedoch, mindestens 50 Beobachtungen zu verwenden. Größere Stichproben ergeben zudem präzisere Schätzwerte der Prozessparameter, z. B. für den Mittelwert und die Standardabweichung.

Statistik

VariableNN*MittelwertSE des
Mittelwerts
StdAbwMinimumQ1MedianQ3Maximum
Drehmoment68021,26470,7787846,4220210162024,7537
Wichtigstes Ergebnis: N

In diesen Ergebnissen liegen 68 Beobachtungen vor.

Schritt 2: Zentrum der Daten beschreiben

Verwenden Sie den Mittelwert, um die Stichprobe mit einem einzelnen Wert zu beschreiben, der das Zentrum der Daten darstellt. In vielen statistischen Analysen wird der Mittelwert als Standardmaß für die Lage der Datenverteilung verwendet.

Der Median ist ein weiteres Maß für die Lage der Verteilung der Daten. Der Median wird im Allgemeinen weniger von Ausreißern beeinflusst als der Mittelwert. Die Hälfte der Datenwerte ist größer als der Median, und die Hälfte der Datenwerte ist kleiner als der Median.

Sowohl der Median als auch der Mittelwert sind ein Maß für die Zentraltendenz. Ungewöhnliche Werte (als Ausreißer bezeichnet) wirken sich jedoch u. U. weniger auf den Median als auf den Mittelwert aus. Bei symmetrischen Daten sind der Mittelwert und der Median ähnlich.
Symmetrisch
Nicht symmetrisch

Bei der symmetrischen Verteilung ähneln sich der Mittelwert (blaue Linie) und der Median (orangefarbene Linie) so sehr, dass die Linien nicht ohne weiteres unterschieden werden können. Die nicht symmetrische Verteilung ist jedoch rechtsschief.

Statistik

VariableNN*MittelwertSE des
Mittelwerts
StdAbwMinimumQ1MedianQ3Maximum
Drehmoment68021,26470,7787846,4220210162024,7537
Wichtigste Ergebnisse: Mittelwert und Median

In diesen Ergebnissen beträgt der Mittelwert des Drehmoments, der erforderlich ist, um die Verschlusskappe einer Zahnpastatube abzuschrauben, 21,265, und der Median des Drehmoments ist 20. Die Daten scheinen eine Rechtsschiefe aufzuweisen. Dies erklärt, warum der Mittelwert größer als der Median ist.

Schritt 3: Streubreite der Daten beschreiben

Verwenden Sie die Standardabweichung, um die Streubreite der Daten um den Mittelwert zu ermitteln. Ein höherer Wert der Standardabweichung verweist auf eine größere Streubreite der Daten.

Statistik

VariableNN*MittelwertSE des
Mittelwerts
StdAbwMinimumQ1MedianQ3Maximum
Drehmoment68021,26470,7787846,4220210162024,7537
Wichtigstes Ergebnis: StdAbw

In diesen Ergebnissen beträgt die Standardabweichung 6,422. Bei normalverteilten Daten liegen die meisten Beobachtungen innerhalb von 3 Standardabweichungen auf jeder Seite des Mittelwerts.

Schritt 4: Form und Streubreite der Datenverteilung auswerten

Verwenden Sie das Histogramm, das Einzelwertdiagramm und das Boxplot, um die Form und Streubreite der Daten auszuwerten und potenzielle Ausreißer zu identifizieren.

Untersuchen der Streubreite der Daten, um zu ermitteln, ob die Daten schief sind

Wenn Daten schief sind, befinden sich die meisten Daten im oberen oder unteren Teil der Grafik. Schiefe ist häufig am einfachsten mit einem Histogramm oder Boxplot zu erkennen.

Rechtsschief
Linksschief

Das Histogramm mit rechtsschiefen Daten zeigt Wartezeiten. Der Großteil der Wartezeiten ist relativ kurz, nur wenige Wartezeiten sind lang. Das Histogramm mit linksschiefen Daten zeigt Daten zu Ausfallzeiten. Einige Elemente fallen sofort aus, deutlich mehr Elemente fallen später aus.

Ermitteln, wie stark die Daten variieren

Werten Sie die Streubreite der Punkte aus, um zu ermitteln, wie stark Ihre Stichprobe variiert. Je größer die Streuung in der Stichprobe, desto mehr Punkte liegen weiter entfernt vom Zentrum der Daten.

Dieses Einzelwertdiagramm zeigt, dass die Daten auf der rechten Seite eine stärkere Streuung als die Daten auf der linken Seite aufweisen.

Suchen nach multimodalen Daten

Multimodale Daten weisen mehrere Spitzen auf, die auch als Modalwerte bezeichnet werden. Multimodale Daten deuten oftmals darauf hin, dass wichtige Variablen noch nicht berücksichtigt wurden.

Wenn Sie über zusätzliche Informationen verfügen, die es Ihnen ermöglichen, die Beobachtungen in Gruppen zu gliedern, können Sie anhand dieser Informationen eine Gruppierungsvariable anlegen. Dann können Sie die Grafik mit den Gruppen erstellen, um zu ermitteln, ob die Gruppierungsvariable die Spitzen in den Daten erklärt.

Einfach
Mit Gruppen

Ein Manager in einer Bank erfasst beispielsweise Daten zu Wartezeiten und erstellt ein einfaches Histogramm. Das Histogramm weist zwei Spitzen auf. Nach eingehenderen Untersuchungen stellt der Manager fest, dass die Wartezeiten für Kunden, die Schecks einlösen, kürzer als die Wartezeiten für Kunden sind, die einen Eigenheimkredit beantragen. Der Manager fügt eine Gruppierungsvariable für den Besuchszweck hinzu und erstellt dann ein Histogramm mit Gruppen.

Identifizieren von Ausreißern

Ausreißer, d. h. Daten, die sich weit entfernt von den anderen Datenwerten befinden, können starke Auswirkungen auf die Ergebnisse Ihrer Analyse haben. Häufig lassen sich Ausreißer am einfachsten in einem Boxplot erkennen.

In einem Boxplot werden Ausreißer mit einem Asterisk (*) gekennzeichnet.

Versuchen Sie, die Ursache für die Ausreißer zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (so genannte Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse. Weitere Informationen finden Sie unter Identifizieren von Ausreißern.

Schritt 5. Daten aus verschiedenen Gruppen vergleichen

Wenn Sie eine Gruppierungsvariable verwenden, mit der Gruppen in den Daten identifiziert werden, können Sie diese verwenden, um die Daten nach Gruppe oder Gruppenstufe zu analysieren.

Statistik

VariableMaschineNN*MittelwertSE des
Mittelwerts
StdAbwMinimumQ1MedianQ3
Drehmoment136018,66670,7324674,394801015,251721,75
  232024,18751,258397,118521417,52431
VariableMaschineMaximum
Drehmoment130
  237

In diesen Ergebnissen werden die zusammenfassenden Statistiken getrennt nach Maschine berechnet. Die Differenzen beim Zentrum und der Streubreite der Daten pro Maschine sind leicht ersichtlich. Beispielsweise weist Maschine 1 ein niedrigeres mittleres Drehmoment und eine geringere Streuung als Maschine 2 auf. Um zu ermitteln, ob die Differenz der Mittelwerte signifikant ist, können Sie einen t-Test bei zwei Stichproben durchführen.