分布の中央および広がりを調べます。サンプルサイズが幹葉図の表示にどう影響するかを評価します。
各行では、「幹」の数は(真ん中の列)はサンプル値の1桁目の数字(または複数桁の数字)を表します。プロット上部の「葉単位」は、葉の値がどの小数位を表すかを示します。
異常なまたは望ましくない特性を調査します。たとえば、顧客待ち時間の幹葉図により、予想よりも高い値と大きな広がりがあることがわかりました。調査により、Webトラフィックが異常に重いため不安定で遅延が生じていることが明らかになりました。
歪んだデータとマルチモーダルデータは、データが正しくない可能性を示します。外れ値は、データの他の条件を示していることがあります。
データが歪んでいるかどうかを判断します。データが歪んでいる場合、ほとんどのデータがグラフの上下に位置していることになります。歪みはデータが正規に分布されていない可能性を示唆しています。ヒストグラムや箱ひげ図では歪みを検出するのが最も簡単であるケースが多いです。
これらの幹葉図は歪んだデータを示しています。右方向に歪んだデータは、待ち時間を示します。待ち時間のほとんどは比較的短く、ごく少数の待ち時間だけが長くなります。左方向に歪んだデータは、故障寿命を示します。少数の項目が直ちに故障し、より多くの項目が後で故障します。
データの歪みが不自然だと思ったら、可能な原因を調査します。歪みのひどいデータを分析する場合は、分析のデータに関する考慮事項のトピックを読んで、正常でないデータを使おうとしているのかを確認します。
外れ値は、他の大部分のデータから離れているデータ値のことで、分析の結果に大きな影響を及ぼします。
外れ値がある場合は、その原因を特定してください。データ入力の誤差を修正してください。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。
マルチモーダルデータには、複数のピークがあります(ピークはデータセットのモードを示します)。マルチモーダルデータは、一般的に、データが複数のプロセスまたは複数の温度などの条件から収集される場合に、発生します。
たとえば、これらの幹葉図は、同じデータのグラフです。単一の幹葉図には2つのクラスターの点がありますが、クラスターが何を意味しているかは不明です。グループを使用した幹葉図は、クラスターが2つのグループに対応することを示しています。
観測値をグループに分類できるようにする追加情報がある場合は、その情報に基づいてグループ変数を作成できます。それから、グループのグラフを作成し、データのピークがそのグループ変数によって説明されるかどうかを判定できます。