周辺分布図の主要な結果を解釈する

周辺分布図を解釈するには、次の手順を実行します。

ステップ1:モデル関係を探してその強さを評価する

データに最も適したモデル関係を判定し、関係の強さを評価します。

ヒント

特定のモデルの適合値がどの程度データに適しているかを視覚化するには、適合回帰線を持つ散布図を作成します。

関係のタイプ

データに最も適したモデルがあればその関係を判定し、関係の強さを評価します。次の例では、さまざまな種類の関係が示されています。
直線:正
直線:負
曲線:2次
曲線:立方
関係なし

データがモデルに適合しそうな場合は、回帰分析を使用して、関係を探ることができます。

関係の強さ

データがモデルにどの程度適合しているかを評価して、XとYの関係の強さを推定します。関係が強い場合、回帰式はデータを正確にモデル化します。
より弱い関係
より強い関係

線形(直線)の関係の強さを計るために、相関分析を用います。

ステップ2:非正規なまたは異常なデータの指標を探す

歪んだデータとマルチモーダルデータは、データが正しくない可能性を示します。外れ値は、データの他の条件を示していることがあります。

歪んだデータ

データが歪んでいる場合、ほとんどのデータがグラフの上下に位置していることになります。歪みはデータが正規に分布されていない可能性を示唆しています。周辺散布図では、周辺部のグラフに歪みのあるデータの指標があるかを確認します。

たとえば、次の右に歪んだデータのグラフは、待ち時間を表示しています。待ち時間のほとんどは比較的短く、ごく少数の待ち時間だけが長くなります。次の左に歪んだデータのグラフは、故障時間を示しています。いくつかの項目はすぐに失敗し、より多くのアイテムが後で失敗します。
ヒストグラム
右方向の歪み
左方向の歪み
ドットプロット
右方向の歪み
左方向の歪み
箱ひげ図
右方向の歪み
左方向の歪み

データの歪みが不自然だと思ったら、可能な原因を調査します。歪みのひどいデータを分析する場合は、分析のデータに関する考慮事項のトピックを読んで、正常でないデータを使おうとしているのかを確認します。

外れ値

外れ値は、他の大部分のデータから離れているデータ値のことで、分析の結果に大きな影響を及ぼします。周辺散布図では、周辺部の散布図とグラフで外れ値を確認します。

散布図
散布図では、孤立点で外れ値が識別されます。
ヒストグラム
ヒストグラムは、端部の孤立したバーによって外れ値が示されます。
ドットプロット
ドットプロットでは、異常に低いか、または高いデータ値によって、潜在的な外れ値が識別されます。
箱ひげ図
箱ひげ図では、アスタリスク(*)によって外れ値が識別されます。

外れ値がある場合は、その原因を特定してください。データ入力や測定の誤差はすべて修正します。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。

マルチモーダルデータ

マルチモーダルデータには、1つ以上のピークがあります(ピークはデータセットのモードを示します)。マルチモーダルデータは、一般的に、データが1つ以上のプロセスまたは複数の温度などの条件から収集される場合に、発生します。

周辺散布図では、周辺部のグラフのヒストグラムまたはドットプロットで、複数モーダルデータの指標があるかを確認します。たとえば、これらのグラフには2つの頂点があります。
ヒストグラム
ドットプロット

観測値をグループに分類可能な追加情報がある場合、追加情報を持つグループ変数を作成できます。その後、ヒストグラムまたはドットプロットを作成して、グループ変数でデータの頂点を説明できるかどうかを判断できます。