回帰分析または分散分析におけるモデルの仮定の検証

モデルがあてはまるだけでは、回帰分析と分散分析は終了しません。モデルが適切であり、回帰仮定が満たされているかどうか確認するために残差プロットおよび他の診断統計量を調べる必要があります。モデルが適切でない場合は、次のようにデータが誤って表されます。
  • 係数の標準誤差により、偏りがあり、誤ったt値とp値が算出されている可能性があります。
  • 係数が誤った符合を持っている可能性があります。
  • モデルは1つか2つの点により影響を受ける可能性があります。
モデルが適切かどうか確認するために次の表を使用します。
適切な回帰モデルの特徴 確認方法 解決法
関数形が曲面性を正確にモデル化しています。

不適合度検定

残差対変数プロット

モデルに高次の項を追加する

変数を変換する

非線形回帰

残差の分散が一定です。

残差対適合値プロット

変数を変換する

重み付け最小二乗を使用する

残差が互いに独立しています(相関していない)。

ダービン-ワトソンの統計量

残差対順序プロット

新しい予測変数を追加する

時系列分析を使用する

遅れ(Lag)変数を追加する

残差が正規分布に従います。

残差のヒストグラム

残差の正規プロット

残差対適合値プロット

正規性検定

変数を変換する

外れ値を確認する

異常な観測値または外れ値が存在しません。

残差プロット

てこ比

クックの距離

DFITS

変数を変換する

外れ値である観測値を取り除く

データは悪条件を有していません。

分散拡大係数(VIF: Variance Inflation Factor)

予測変数の相関行列

予測変数を取り除く

PLS回帰を使用する

変数を変換する

モデルが仮定を満たさない理由を確認する

モデルが上記の条件に適合しない場合、次のような対策が必要です。
  1. データが正確に入力されているかどうか、特に観測値が異常と識別されていないかどうかを確認します。
  2. 問題の原因を調べます。モデルが問題にどの程度影響されるかを調べます。たとえば、外れ値が存在する場合、観測値なしの回帰分析を実行し、結果の違いを調べます。
  3. 上記の考えられる解決方法の1つの使用を検討します。