回帰モデルの適合および線形回帰の診断手段の方法と式

目的の方法または計算式を選択してください。

てこ比（Hi）

てこ比はn x nの射影行列であるハット行列（H）より求められます。

i番目の観測値のてこ比は、i番目の対角要素Hのh_iです。h_iの値が大きい場合、i番目の観測値は異常な予測変数（X_1i, X_2i, ..., X_pi）を持ちます。つまり、予測変数の値は平均ベクトルから離れているので、マハラノビス距離を使用します。

てこ比は0から1の間の値で、Minitabの異常な観測値の表では、観測値のてこ比が3p/nまたは0.99のいずれか小さい方を超えていることがXという文字によって示されます。通常は値が大きいてこ比値を調べます。

検証データでは、各行のてこ比は次式から得られます。

重み付き回帰では、計算式に重みが含まれます。

用語	説明
X	design matrix for the rows in the training data set or the folds that act as the training data set
x_i	the vector of predictors in the i番目の validation row
w_i	weight for the i番目の validation row

推定される回帰係数全体の観測値に対する複合的影響を測る総合的な測度、Dです。Dは、てこ比値と標準化残差を使用して計算され、観測値がx値とy値の両方について異常であるかどうかが考慮されます。D値が大きい観測値は外れ値である可能性があります。

クックの距離は、i番目の観測値を使用して計算した係数と観測値を使用せずに計算した係数との間の距離です。Minitabでは観測値を省略するたびに新たな回帰式を当てはめることなくクックの距離を計算します。計算式は以下の通りです。

てこ比とスチューデント化残差（削除した残差t）を結合させて1つの測度とし、観測値の異常度を測定します。DFITSは回帰モデルまたは分散分析（ANOVA）モデルの適合値に対する各観測値の影響を測定します。DFITS値が大きい観測値は外れ値である可能性があります。

DFITSは、各観測値をデータセットから取り除きモデルを再度適合させたときに適合値が変化するおおよその標準偏差を表します。Minitabでは観測値が外されるたびに、新たな回帰式を当てはめずにDFITSを計算することができます。