访问数据分布的方式

一组数据可按许多不同方式分布或散布。例如,掷骰子所得的数据可以是从 1 到 6 的随机整数值。制造过程所得的数据可以目标值为中心进行分布,也可以包括远离中心值的数据值。

可以通过图形、描述性统计量或者与理论分布的比较来评估数据分布:
图形
通过图形(如直方图),可以直接深入了解数据集的分布情况。直方图可以帮助您观测:
  • 数据聚类是围绕单个值,还是具有多个峰值或模式。
  • 数据是稀疏散布于宽广的范围,还是位于较小的范围。
  • 数据是偏斜的还是对称的。
描述性统计量
用于描述包含数字值的数据的中心趋势(平均值、中位数)和展开(方差、标准差)的描述性统计,这些统计添加了明细层并且可用于与其他数据集进行比较。
理论分布
最后,一些常见分布可通过正态分布、Weibull 分布和指数分布等进行标识和称呼。例如,正态分布始终为钟形,且沿均值对称分布。
真实数据将只能接近于这些完全分布。如果存在紧密拟合,则可认为数据由给定分布进行了合理建模。可使用统计 > 质量工具 > 个体分布标识来确定最适合您数据的分布。