分布の中央および広がりを調べます。サンプルサイズが箱ひげ図の表示にどう影響するかを評価します。
ポインタを箱ひげ図に乗せると、これらの統計量を示すツールチップが表示されます。たとえば、この箱ひげ図の安静時の心拍数の中央値は71です。ほとんどの対象では、安静時の心拍数は64~80ですが、低い時は48、高い時は100になるものもあります。
箱ひげ図の通常ではない特性または望ましくない特性を調査します。たとえば、箱ひげ図は、木板の長さの中央値が目標の8フィートよりもはるかに低い値を取ることがあります。
箱ひげ図の四分位間範囲は計算された値であるため、データセットの実観測値ではないかもしれません。四分位間範囲の解釈の仕方に関する詳細は、四分位数とはを参照します。四分位間範囲の計算方法の詳細は、グラフィカルサマリの方法と計算式を参照してください。
サンプルサイズはグラフの表示に作用する可能性があります。
箱ひげ図は、サンプルサイズが少なくとも20の場合に最適です。サンプルサイズが小さすぎると、箱ひげ図に示される四分位数や外れ値は意味がない場合があります。サンプルサイズが20未満の場合は、代わりに個別値プロットの使用を検討してください。
歪んだデータは、データが正しくない可能性を示します。外れ値は、データの他の条件を示していることがあります。
データが歪んでいる場合、ほとんどのデータがグラフの上下に位置していることになります。歪みはデータが正規に分布されていない可能性を示唆しています。
これらの箱ひげ図は、歪んだデータを示しています。右に歪んだデータによる箱ひげ図には、待ち時間が表示されます。待ち時間のほとんどは比較的短く、ごく少数の待ち時間だけが長くなります。左に歪んだデータによる箱ひげ図には、故障時間が表示されます。少数の項目が直ちに故障し、より多くの項目が後で故障します。
データの歪みが不自然だと思ったら、可能な原因を調査します。歪みのひどいデータを分析する場合は、分析のデータに関する考慮事項のトピックを読んで、正常でないデータを使おうとしているのかを確認します。
外れ値は、他の大部分のデータから離れているデータ値のことで、分析の結果に大きな影響を及ぼします。多くの場合、外れ値は、箱ひげ図で容易に識別できます。
外れ値の上にポインタを合わせて、データ点を識別します。
外れ値がある場合は、その原因を特定してください。データ入力や測定の誤差はすべて修正します。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。
箱ひげ図にグループがある場合は、グループの中央と広がりを評価し、比較します。
グループの中央間の差を探します。
グループの広がりの間の差を探します。