四分位数は、データのサンプルを4等分した値です。四分位数を利用すると、データセットの広がりや中心傾向をすばやく評価でき、データを理解する上での重要な第一歩となります。

四分位数 説明
第1四分位数(Q1) データの25%がこの値以下になります。
第2四分位数(Q2) 中央値です。データの50%がこの値以下になります。
第3四分位数(Q3) データの75%がこの値以下になります。
四分位間範囲 第1四分位数と第3四分位数(Q3-Q1)の距離です。
たとえば、データ7、9、16、36、39、45、45、46、48、51を例に取ります。
  • Q1 = 14.25
  • Q2(中央値) = 42
  • Q3 = 46.50
  • 四分位間範囲 = 14.25から46.50まで、つまり32.25

四分位間範囲はデータの観測値ではなく計算された値です。多くの場合、正確に四分位数を計算するには、2つの観測値間に内挿する必要があります。

極端な観測値には影響されないため、大きく歪んでいるデータの中心傾向と広がりの測度としては、中央値や四分位間範囲の方が平均や標準偏差より優れています。