個別値プロットの主要な結果を解釈する

個別値プロットを解釈するには、次の手順を実行します。

ステップ1:主要特性を評価する

分布の中央および広がりを調べます。サンプルサイズが個別値プロットの表示にどう影響するかを評価します。

中央と広がり

最も密な記号のクラスタを判別します。最高密度のクラスタは、最も一般的な値を示します。それぞれのグループの広がりを評価して、データがどれだけ異なるかを理解します。観測値を説明するツールチップを閲覧するには、ポインタを好きな点の上に置きます。

たとえば、このプラスチック製パイプの直径の個別値プロットでは、広がりが毎週高まっています。

個別値プロットの驚くべき特性または望ましくない特性を調査します。たとえば、ボールベアリングの出荷品から得られた、硬度測定値の個別値プロットは、通常の値の広がりよりも広くなっています。調査によって、ボールベアリングの製造工程に変更が加えられたことで、ばらつきが増えたことがわかりました。

サンプルサイズ(n)

サンプルサイズはグラフの表示に作用する可能性があります。

たとえば、これらの個別値プロットはかなり異なっているように見えますが、どちらも同じ母集団から無作為に選ばれたデータのサンプルを使用して作成されています。

個別値プロットは、サンプルサイズが約50未満の場合に最適です。サンプルが大きすぎると、プロット上のデータ点が密集しすぎて、分布の評価が難しくなる可能性があります。サンプルサイズが50より大きい場合、代わりに箱ひげ図ヒストグラムの使用を検討してください。

ステップ2:非正規または異常なデータの指標を探す

歪んだデータとマルチモーダルデータは、データが正しくない可能性を示します。外れ値は、データの他の条件を示していることがあります。

歪んだデータ

データが歪んでいるかどうかを判断します。データが歪んでいる場合、ほとんどのデータがグラフの上下に位置していることになります。歪みはデータが正規に分布されていない可能性を示唆しています。ヒストグラム箱ひげ図では歪みを検出するのが最も簡単であるケースが多いです。

個別値プロットは歪んだデータを示しています。右方向に歪んだデータは、待ち時間を示します。待ち時間のほとんどは比較的短く、ごく少数の待ち時間だけが長くなります。左方向に歪んだデータは、故障寿命を示します。少数の項目が直ちに故障し、より多くの項目が後で故障します。

右方向の歪み
左方向の歪み

データの歪みが不自然だと思ったら、可能な原因を調査します。歪みのひどいデータを分析する場合は、分析のデータに関する考慮事項のトピックを読んで、正常でないデータを使おうとしているのかを確認します。

外れ値

外れ値は、他の大部分のデータから離れているデータ値のことで、分析の結果に大きな影響を及ぼします。

個別値プロットでは、異常に低いか、または高いデータ値によって、潜在的な外れ値が識別されます。

外れ値の上にポインタを合わせて、データ点を識別します。

外れ値がある場合は、その原因を特定してください。データ入力の誤差を修正してください。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。

マルチモーダルデータ

マルチモーダルデータには、モードとも呼ばれる複数のクラスタがあります。マルチモーダルデータは、多くの場合、重要な変動がまだ説明されていないことを示します。

たとえば、これらの個別値プロットは、同じデータのグラフです。単純個別値プロットには2つのクラスタがありますが、クラスタが何を意味しているかは不明です。グループを使用した個別値プロットは、クラスタが2つのグループに対応することを示しています。

単純
グループ

観測値をグループに分類できるようにする追加情報がある場合は、その情報に基づいてグループ変数を作成できます。それから、グループのグラフを作成し、データのピークがそのグループ変数によって説明されるかどうかを判定できます。

ヒント

既存のグラフにグループ変数を追加するには、グラフ内のデータ表現をダブルクリックし、次にグループタブをクリックします。

ステップ3:グループの評価と比較

個別値プロットにグループがある場合は、グループの中央と広がりを評価し、比較します。

中央

グループの中央間の差を探します。

たとえば、この個別値プロットでは、3つのメーカーが生産したワイヤの厚みを示しています。メーカーごとのワイヤの厚みの中央値は異なるように見えます。
平均間の差が統計的に有意かどうかを判断するには、次のいずれかを実行します。

広がり

グループの広がりの間の差を探します。

たとえば、この個別値プロットでは、3つの生産ラインでのシリアル箱の充填重量を示しています。重量の分布の中央はほぼ同じですが、一部のグループの重量は他のグループよりもばらつきが大きくなっています。
広がり(分散)の間の差が統計的に有意かどうかを判断するには、次のいずれかを実行します。