四分位数は、データのサンプルを4等分した値です。四分位数を利用すると、データセットの広がりや中心傾向をすばやく評価でき、データを理解する上での重要な第一歩となります。
四分位数 | 説明 |
---|---|
第1四分位数(Q1) | データの25%がこの値以下になります。 |
第2四分位数(Q2) | 中央値です。データの50%がこの値以下になります。 |
第3四分位数(Q3) | データの75%がこの値以下になります。 |
四分位間範囲 | 第1四分位数と第3四分位数(Q3-Q1)の距離です。 |
四分位間範囲はデータの観測値ではなく計算された値です。多くの場合、正確に四分位数を計算するには、2つの観測値間に内挿する必要があります。
極端な観測値には影響されないため、大きく歪んでいるデータの中心傾向と広がりの測度としては、中央値や四分位間範囲の方が平均や標準偏差より優れています。