四分位数是将数据样本分成四个相等部分的值。利用四分位数,可以快速评估数据集的散布和中心趋势 – 这是了解数据的重要前期步骤。
四分位数 | 说明 |
---|---|
第一个四分位数 (Q1) | 25% 的数据小于等于此值。 |
第二个四分位数 (Q2) | 中位数。50% 的数据小于等于此值。 |
第三个四分位数 (Q3) | 75% 的数据小于等于此值。 |
四分位间距 | 第一个四分位数与第三个四分位数之间的距离 (Q3-Q1);因此,它跨越数据中间部分(即 50%)。 |
四分位数是计算值,而不是数据中的观测值。通常,需要在两个观测值之间插值才能正确计算出四分位数。
由于不受极端观测值的的影响,因此与均值和标准差相比,中位数和四分位间距是对高度偏斜数据的中心趋势和散布程度的更好度量。