変動性の分析の残差プロット

すべての残差プロットの定義と解釈について解説します。

残差のヒストグラム

残差のヒストグラムは、すべての観測値について残差の分布を示します。

解釈

残差のヒストグラムを使用して、データが歪んでいるかどうか、またはデータに外れ値があるかどうかを判断します。以下の表にあるパターンは、このモデルが、モデルの仮説を満たさないことを示している可能性があります。
パターン パターンが示す意味
1つの方向に伸びている 歪度
1本のバーが他のバーから離れている 外れ値

ヒストグラムの外観は、データをグループ化するために使用されている区間の数に依存するので、残差の正規性を評価するときにヒストグラムは使用しません。

ヒストグラムは、データ点が約20個以上ある場合に最も効果的です。サンプルが小さすぎる場合、ヒストグラム上の各バーには歪度や外れ値を確実に表示するだけの十分なデータ点がありません。

残差対適合値

残差対適合値グラフでは、y軸に残差が、x軸に適合値がプロットされます。

解釈

残差対適合値プロットを使用して、残差はランダムに分布し、均一な分散が存在するという仮定を検証します。点が特徴的なパターンがなく0の両側にランダムに来るのが理想的です。

以下の表にあるパターンは、このモデルが、モデルの仮説を満たさないことを示している可能性があります。
パターン パターンが示す意味
残差が適合値周辺に扇状または不均等に分散している 不均一分散
曲線 高次の項の欠損
ゼロから遠い点 外れ値
ある点が他の点からX軸方向に遠く離れている 影響力のある点
次のグラフは外れ値や、残差の分散が均一であるという仮定に反する項目を表示します。
外れ値のあるプロット

ある点が他の点に比べて大きいため、この点は外れ値となります。外れ値が多すぎる場合は、モデルが適切ではない可能性があります。外れ値の原因を識別する必要があります。データ入力や測定の誤差はすべて修正します。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。

不均一分散のプロット

残差の分散が適合値の増加とともに増加しています。適合値が大きくなるにつれ、残差間でばらつきが大きくなっていることに注意してください。このパターンは、残差の分散が等しくない(不均一である)ことを示しています。

残差対適合値プロットに外れ値がある場合は以下の解決策を検討してください。
  1. 観測値が測定の誤りまたはデータ入力の誤りではないことを確認します。
  2. この観測値なしで分析を実行し、結果に与える影響の調査を行います。

残差対データ順序

残差対データ順序プロットには、データの収集順に残差が表示されます。

解釈

残差対データ順序プロットを使用して、残差が互いから独立しているという仮定を検証します。独立している残差は、時間順で表示した場合にトレンドやパターンを示しません。点にパターンがある場合、互いに近い残差は相関している可能性があり、独立していないことを示しています。プロットの残差が中心線の周りにランダムに来るのが理想的です。
パターンがある場合は原因を調査します。パターンが次のタイプである場合、残差が従属している可能性を示しています。
トレンド
シフト
サイクル

残差対変数

残差対変数プロットには、別の変数に対する残差の値が表示されます。その変数は既にモデルに含まれているかもしれません。あるいは含まれていなくても応答変数に影響を与える可能性がある値です。

解釈

変数がすでにモデルに含まれている場合、変数のより高次の項を追加する必要があるかどうかを決定します。変数がモデルに含まれていない場合、プロットを使用して、変数が応答に体系的な影響を及ぼしているかどうかを判定します。

これらのパターンから重要な変数や項を特定することができます。
パターン パターンが示す意味
残差に特定のパターンがある 変数が応答に体系的に影響を及ぼしています。変数がモデル内にない場合、その変数の項をモデルに含めて、モデルを再適合します。
点の分布に曲面性 変数の高次の項をモデルに取り込む必要があります。たとえば、曲線的なパターンは、2次項を追加する必要があることを示しています。