分布の中央および広がりを調べます。サンプルサイズが個別値プロットの表示にどう影響するかを評価します。
最も密な記号のクラスタを判別します。最高密度のクラスタは、最も一般的な値を示します。それぞれのグループの広がりを評価して、データがどれだけ異なるかを理解します。観測値を説明するツールチップを閲覧するには、ポインタを好きな点の上に置きます。
個別値プロットの驚くべき特性または望ましくない特性を調査します。たとえば、ボールベアリングの出荷品から得られた、硬度測定値の個別値プロットは、通常の値の広がりよりも広くなっています。調査によって、ボールベアリングの製造工程に変更が加えられたことで、ばらつきが増えたことがわかりました。
歪んだデータとマルチモーダルデータは、データが正しくない可能性を示します。外れ値は、データの他の条件を示していることがあります。
データが歪んでいるかどうかを判断します。データが歪んでいる場合、ほとんどのデータがグラフの上下に位置していることになります。歪みはデータが正規に分布されていない可能性を示唆しています。ヒストグラムや箱ひげ図では歪みを検出するのが最も簡単であるケースが多いです。
個別値プロットは歪んだデータを示しています。右方向に歪んだデータは、待ち時間を示します。待ち時間のほとんどは比較的短く、ごく少数の待ち時間だけが長くなります。左方向に歪んだデータは、故障寿命を示します。少数の項目が直ちに故障し、より多くの項目が後で故障します。
データの歪みが不自然だと思ったら、可能な原因を調査します。歪みのひどいデータを分析する場合は、分析のデータに関する考慮事項のトピックを読んで、正常でないデータを使おうとしているのかを確認します。
外れ値は、他の大部分のデータから離れているデータ値のことで、分析の結果に大きな影響を及ぼします。
外れ値の上にポインタを合わせて、データ点を識別します。
外れ値がある場合は、その原因を特定してください。データ入力の誤差を修正してください。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。
マルチモーダルデータには、モードとも呼ばれる複数のクラスタがあります。マルチモーダルデータは、多くの場合、重要な変動がまだ説明されていないことを示します。
たとえば、これらの個別値プロットは、同じデータのグラフです。単純個別値プロットには2つのクラスタがありますが、クラスタが何を意味しているかは不明です。グループを使用した個別値プロットは、クラスタが2つのグループに対応することを示しています。
観測値をグループに分類できるようにする追加情報がある場合は、その情報に基づいてグループ変数を作成できます。それから、グループのグラフを作成し、データのピークがそのグループ変数によって説明されるかどうかを判定できます。
既存のグラフにグループ変数を追加するには、グラフ内のデータ表現をダブルクリックし、次にグループタブをクリックします。
個別値プロットにグループがある場合は、グループの中央と広がりを評価し、比較します。
グループの中央間の差を探します。
グループの広がりの間の差を探します。