要因計画の分析の診断測度の方法と計算式

てこ比(Hi)

てこ比はn x nの射影行列であるハット行列(H)より求められます。

i番目の観測値のてこ比は、i番目の対角要素Hhiです。hiの値が大きい場合、i番目の観測値は異常な予測変数(X1i, X2i, ..., Xpi)を持ちます。つまり、予測変数の値は平均ベクトルから離れているので、マハラノビス距離を使用します。

てこ比は0から1の間の値で、Minitabの異常な観測値の表では、観測値のてこ比が3p/nまたは0.99のいずれか小さい方を超えていることがXという文字によって示されます。通常は値が大きいてこ比値を調べます。

表記

用語説明
X計画行列
hiハット行列のi番目の対角要素
p定数項を含むモデル内の項の数
n観測値数

クック(Cook)の距離

推定される回帰係数全体の観測値に対する複合的影響を測る総合的な測度、Dです。Dは、てこ比値と標準化残差を使用して計算され、観測値がx値とy値の両方について異常であるかどうかが考慮されます。D値が大きい観測値は外れ値である可能性があります。

計算式

クックの距離は、i番目の観測値を使用して計算した係数と観測値を使用せずに計算した係数との間の距離です。Minitabでは観測値を省略するたびに新たな回帰式を当てはめることなくクックの距離を計算します。計算式は以下の通りです。

表記

用語説明
ei i番目の残差
hi i番目の対角要素
p 定数を含むモデルパラメータの数
s 2 誤差の平均平方
b 係数ベクトル
b(i) i番目の観測値を削除した後に計算した係数ベクトル
X 計画行列

DFITS

てこ比とスチューデント化残差(削除した残差t)を結合させて1つの測度とし、観測値の異常度を測定します。DFITSは回帰モデルまたは分散分析(ANOVA)モデルの適合値に対する各観測値の影響を測定します。DFITS値が大きい観測値は外れ値である可能性があります。

DFITSは、各観測値をデータセットから取り除きモデルを再度適合させたときに適合値が変化するおおよその標準偏差を表します。Minitabでは観測値が外されるたびに、新たな回帰式を当てはめずにDFITSを計算することができます。

計算式

表記

用語説明
ei i番目の残差
hi i番目の対角要素
X 計画行列
i番目の適合された応答
i番目の観測値を使わずに計算された適合値
平均平方誤差 (i) i番目の観測値を使わずに計算された誤差の平均平方
n 観測値数
p モデルのパラメータ数