i番目の観測値のてこ比は、i番目の対角要素Hのhiです。hiの値が大きい場合、i番目の観測値は異常な予測変数(X1i, X2i, ..., Xpi)を持ちます。すなわち、マハラノビス距離に基づくと予測値は平均ベクトルから離れていることになります(X1, X2,..., Xp)。
てこ比は0から1の間の値で、Minitabの異常な観測値の表では、観測値のてこ比が3p/nまたは0.99のいずれか小さい方を超えていることがXという文字によって示されます。通常は値が大きいてこ比値を調べます。
用語 | 説明 |
---|---|
X | 計画行列 |
hi | ハット行列のi番目の対角要素 |
p | モデルにおける項の数 |
n | 観測値数 |
推定される回帰係数全体の観測値に対する複合的影響を測る総合的な測度、Dです。Dは、てこ比値と標準化残差を使用して計算され、観測値がX値とY値の両方について異常であるかどうかが考慮されます。D値が大きい観測値は外れ値である可能性があります。
クックの距離は、i番目の観測値を使用して計算した係数と観測値を使用せずに計算した係数との間の距離です。Minitabでは観測値を省略するたびに新たな回帰式を当てはめることなくクックの距離を計算します。計算式は以下の通りです。
用語 | 説明 |
---|---|
ei | i番目の残差 |
hi | i番目の対角要素 |
p | モデルのパラメータ数 |
s2 | 誤差の平均平方 |
b | 係数ベクトル |
b(i) | i番目の観測値を削除した後に計算した係数ベクトル |
X | 計画行列 |
てこ比とスチューデント化残差(削除した残差t)を結合させて1つの測度とし、観測値の異常度を測定します。DFITSは回帰モデルまたは分散分析(ANOVA)モデルの適合値に対する各観測値の影響を測定します。DFITS値が大きい観測値は外れ値である可能性があります。
DFITSは、各観測値をデータセットから取り除きモデルを再度適合させたときに適合値が変化するおおよその標準偏差を表します。Minitabでは観測値が外されるたびに、新たな回帰式を当てはめずにDFITSを計算することができます。
用語 | 説明 |
---|---|
ei | i番目の残差 |
hi | i番目の対角要素 |
X | 計画行列 |
i番目の適合された応答 | |
i番目の観測値を使わずに計算された適合値 | |
平均平方誤差 (i) | i番目の観測値を使わずに計算された誤差の平均平方 |
n | 観測値数 |
p | モデルのパラメータ数 |