Minitabに含まれる残差の種類

Minitabでは3種類の残差が計算されます。

通常の残差

残差とは、観測値(y)とそれに対応する適合値().

たとえば、この散布図は人々の身長に対する体重をプロットしたものです。適合回帰直線は、身長の観測値ごとの体重の適合値をプロットしています。ある人の身長が6フィートで体重の適合値が190ポンドだとします。実際の体重が200ポンドの場合、残差は10となります。

残差をプロットし、他の診断統計量を使用すると、モデルが適切であり、回帰仮定が満たされているかどうかを確認できます。残差は、モデルによって観測データの変動がどれだけ説明できるかを識別することもできます。

標準化残差

標準化残差は、残差(ei)をその標準偏差の推定値で割ったものです。一般に、標準化残差が2より大きい場合や-2より小さい場合は、標準化残差が大きいと見なされ、異常な観測値の表や適合値と残差の表では、このような観測値に「R」というラベルを付けて識別します。ラベルがつけられた観測値は、提示された回帰式にしっかりとは従っていません。ただし、いくつかの異常な観測値があることは予測されています。たとえば、大きな標準化残差の基準に基づくと、観測値の約5%は大きな標準化残差を持つとしてフラグがつけられることが予測されます。

標準化残差を使用すると、外れ値を検出しやすくなります。残差の標準化が役に立つのは、不均一分散が存在する場合に生の残差が外れ値を識別するものとして許容されない場合があるためです。から離れたx値を持つ残差がから離れたx値を持つ残差がに近いx値よりも分散が大きい場合、外れ値を検出するのは難しくなります。この不均一分散を標準化して管理すると、すべての標準化残差は同じ標準偏差を持つことになります。

標準化残差は、内部的スチューデント化残差とも呼ばれます。

スチューデント化削除残差

観測値のスチューデント化削除残差とは、観測値の削除した残差をその標準偏差の推定値で割ったものです。削除した残差diは、yiと、i番目の観測値を計算から除外したモデルにおける適合値との差のことです。観測値を除外したのは、潜在的な外れ値がない状態でのモデルの動作を見るためです。観測値に大きいスチューデント化削除残差がある(絶対値が2より大きい)場合は、データ内の外れ値の可能性があります。

削除した残差を使用すると、外れ値を検出しやすくなります。削除した残差が役に立つのは、不均一分散が存在する場合に生の残差が外れ値を識別するものとして許容されない場合があるためです。から離れたx値を持つ残差がから離れたx値を持つ残差がに近いx値よりも分散が大きい場合、外れ値を検出するのは難しくなります。すべての削除した残差は標準偏差が同じになります。

それぞれのスチューデント化削除残差は、自由度が(n–1–p)であるt分布に従っています。pは回帰モデル内の項数に等しくなります。

スチューデント化削除残差は、外部的スチューデント化残差または削除t残差とも呼ばれます。