異常な観測値(影響力のある観測値とも呼ばれる)とは、回帰モデルまたは分散分析モデルに対して不均衡な影響を持つ観測値です。異常な観測値は、紛らわしい結果を導き出す可能性があるため検出しておく必要があります。たとえば、異常な観測値によって有意な係数が有意ではないように見える場合があります。
ラベルがつけられた観測値は、提示された回帰式にしっかりとは従っていません。ただし、いくつかの異常な観測値があることは予測されています。たとえば、大きな残差の基準に基づくと、観測値の約5%は大きな残差を持つとしてフラグがつけられることが予測されます。
前の出力で、観測値1はXを付けて表され、てこ比点であることがわかります。観測値22はRをつけて表されているため、外れ値です。
その異常な観測値の影響力を判断するには、観測値有り、無しのモデルを適合し、係数、p値、R2、その他のモデルパラメータを比較します。異常な観測値を除外したときにモデルが大きく変化する場合は、まず観測値がデータ入力エラーまたは測定エラーでないかどうかを調べます。そうでない場合は、重要な項(交互作用項など)や変数を省略していないか、またはモデルを誤って指定していないかを調べます。問題を解決するには、より多くのデータが必要になることもあります。