回帰モデルの適合の適合値と残差を求める方法と計算式

目的の方法または計算式を選択してください。

適合値

表記

用語説明
適合値
xkk番目の項。各項は1つの予測変数、多項式の項、または交互作用項になり得ます。
bkk番目の回帰係数の推定値

適合値の標準誤差(SE Fit)

1つの予測変数を持つ回帰モデルにおける適合値の標準誤差:

2つ以上の予測変数を持つ回帰モデルにおける適合値の標準誤差:

重み付け回帰の場合、式に重み行列を含めます。

データにテスト データセットまたは K 折りクロス検証がある場合、数式は同じです。の値 s2はトレーニングデータから。設計マトリックスと重量マトリックスもトレーニングデータから取得されます。

表記

用語説明
s1mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xiii番目の predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x 2」と定義されます。0transpose of the new vector of predictor values
X design matrix
Wweight matrix

適合値の信頼区間値(CI)

計算式

回帰では、適合値の信頼限界は次式で与えられます。

重み付き回帰では、計算式に重みが含まれます。

ここで、tvは両側区間の自由度がvの t 分布の1-α/2分位数です。片側限界の場合、tv は自由度がvのt分布の1-α分位数です。

テストデータセットまたは K分割交差検証を使用する場合、自由度と平均平方誤差は、トレーニングデータセットから得られます。

Box-Cox変換を使用する場合、信頼区間の計算式に逆変換を適用して、元の応答の単位での限界を見つけます。たとえば、Box-Cox変換が自然対数の場合、逆変換は次式で与えられます。

表記

用語説明
fitted value
quantile from the t distribution
degrees of freedom
mean square error
leverage for the i番目の observation
wiweight for the i番目の observation

残差

残差とは、観測値とそれに対応する適合値の差です。観測値のこの部分はモデルでは説明ができません。観測値の残差は以下になります。

表記

用語説明
yii番目に観測された応答値
i番目の応答適合値

標準化残差(Std Resid)

標準化残差は、「内部的スチューデント化残差」とも呼ばれます。

計算式

表記

用語説明
ei i番目の残差
hi X(X'X)–1X'i番目の対角要素
s2 誤差の平均平方
X計画行列
X'計画行列の転置

検証の標準化残差 (Std Resid)

検証データでは、標準化残差の計算式の分母は、てこ比を引く代わりに足します。

計算式

重み付き回帰では、式に重みが含まれます。

表記

用語説明
eii 番目の residual in the validation data set
hi leverage for the i番目の validation row
s2mean square error for the training data set
wiweight for the i番目の observation in the validation data set

削除した(スチューデント化)残差

外部でステューデント化された残差とも呼ばれます。計算式は以下になります。

その他の式は以下になります。

i番目の観測値を推定するモデルは、データセットからi番目の観測値を除外します。従ってi番目の観測値は推定値に影響を与えません。削除された各残差には、 の自由度。

表記

用語説明
eii番目の残差
s(i)2i番目の観測値を使わずに計算された平均平方誤差
hi X(X'X)–1X'i番目の対角要素
n観測値数
p定数項を含む項の数
残差平方和(SSE)誤差の平方和