分布のピークおよび広がりを調べます。サンプルサイズがドットプロットの表示にどう影響するかを評価します。
点が集中する瓶であるピークを判別します。ピークは、サンプルで最も一般的な値を示します。データがどれだけ異なるかを理解するために、サンプルの広がりを評価します。
ドットプロットの驚くべき特性または望ましくない特性を調査します。たとえば、顧客の待ち時間のドットプロットでは、広がりが予想以上に広くなっています。調査によって、コンピュータのソフトウェアのアップデートが、顧客の待ち時間に不安定さと遅れを引き起こしたことがわかりました。
サンプルサイズはグラフの表示に作用する可能性があります。
ドットプロットは、サンプルサイズがおおよそ50より小さい場合に最適です。サンプルサイズが50以上の場合、1つのドットが2つ以上の観測値を表すことがあります。分布の1次特性を判別しやすくするために、ドットプロットに加えて、箱ひげ図またはヒストグラムを用いることを検討します。
歪んだデータとマルチモーダルデータは、データが正しくない可能性を示します。外れ値は、データの他の条件を示していることがあります。
データが歪んでいる場合、ほとんどのデータがグラフの上下に位置していることになります。歪みはデータが正規に分布されていない可能性を示唆しています。 データ歪みは、ヒストグラム、または箱ひげ図によって最も簡単に検出する事ができます。
これらのドットプロットは、歪んだデータを示しています。右に歪んだデータによるドットプロットには、待ち時間が表示されます。待ち時間のほとんどは比較的短く、ごく少数の待ち時間だけが長くなります。左に歪んだデータによるドットプロットには、故障時間が表示されます。少数の項目が直ちに故障し、より多くの項目が後で故障します。
データの歪みが不自然だと思ったら、可能な原因を調査します。歪みのひどいデータを分析する場合は、分析のデータに関する考慮事項のトピックを読んで、正常でないデータを使おうとしているのかを確認します。
外れ値は、他の大部分のデータから離れているデータ値のことで、分析の結果に大きな影響を及ぼします。多くの場合、外れ値は、箱ひげ図で容易に識別できます。
外れ値の上にポインタを合わせて、データ点を識別します。
外れ値がある場合は、その原因を特定してください。データ入力や測定の誤差はすべて修正します。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。
マルチモーダルデータには、1つ以上のピークがあります(ピークはデータセットのモードを示します)。マルチモーダルデータは、一般的に、データが1つ以上のプロセスまたは複数の温度などの条件から収集される場合に、発生します。
たとえば、これらのドットプロットは、同じデータのグラフです。単純ドットプロットには2つのピークがありますが、ピークが何を意味しているかは不明です。グループを使用したドットプロットは、ピークが2つのグループに対応することを示しています。
観測値をグループ分けできる追加的な情報がある場合は、その情報を加えたグループ化変数を作成できます。次に、グループのあるグラフを作成し、グループ変数がデータのピークを説明しているかを判断できます。
既存のグラフにグループ変数を追加するには、グラフ内のデータ表現をダブルクリックし、次にグループタブをクリックします。
ドットプロットにグループがある場合は、グループの中央と広がりを評価し、比較します。
グループの中央間の差を探します。
グループの広がりの間の差を探します。