偏最小二乗回帰の適合値と残差を求める方法と計算式

目的の方法または計算式を選択してください。

適合値

予測されたYまたはは、推定回帰式を使用して得られた予測変数値の平均応答値です。

交差検証された適合値

交差検証された適合値は、モデルがどの程度データを予測するかを示します。これらの値は、モデルのデータへの適合度を示す通常の適合値と同様です。観測値の交差検証された適合値を得るには、モデルを計算するために使用したデータからその値を削除する必要があり、それによって、適合値は、観測値から独立している係数ベクトルと共に計算されます。交差検証された適合値の計算式は以下の通りです。

表記

用語説明
\ii観測値がモデル計算から除外されたことを示します。
b0\i観測値iに含まれないモデルの切片
X予測変数値
B(\i)(j, k)観測値iに含まれないモデルの係数

残差

残差とは、観測値とそれに対応する適合値の差です。観測値のこの部分はモデルでは説明ができません。観測値の残差は以下になります。

表記

用語説明
yii番目に観測された応答値
i番目の応答適合値

交差検証された残差

交差検証された残差はモデルの予測能力を示し、PRESS統計量を計算する際に使用されます。PLSの交差検証残差と最小二乗回帰の考え方は似ていますが、計算方法が異なります。

計算式

PLSの場合、交差検証された残差は、実際の応答と交差検証された適合値との差です。

交差検証された残差値は、交差検証の過程でモデルが再計算されるたびに除外される観測値の数に応じて異なります。

最小二乗回帰では、交差検証残差は通常の残差から直接計算されます。

表記

用語説明
(i)モデル計算から除外された観測値
yi応答値
交差検証された適合値

標準化残差(Std Resid)

標準化残差は、「内部的スチューデント化残差」とも呼ばれます。

計算式

表記

用語説明
ei i番目の残差
hi X(X'X)–1X'i番目の対角要素
s2 誤差の平均平方
X計画行列
X'計画行列の転置

適合値の標準誤差(SE Fit)

1つの予測変数を持つ回帰モデルにおける適合値の標準誤差:

2つ以上の予測変数を持つ回帰モデルにおける適合値の標準誤差:

重み付け回帰の場合、式に重み行列を含めます。

データにテスト データセットまたは K 折りクロス検証がある場合、数式は同じです。の値 s2はトレーニングデータから。設計マトリックスと重量マトリックスもトレーニングデータから取得されます。

表記

用語説明
s1mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xiii番目の predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x 2」と定義されます。0transpose of the new vector of predictor values
X design matrix
Wweight matrix

信頼区間

信頼区間は、特定の予測値のセットに対して推定された平均応答値が含まれると予測される範囲です。この区間は、信頼水準と適合値の標準誤差から計算される下限と上限によって定義されます。

計算式

表記

用語説明
αα値
n観測値数
p予測変数の数
s2平均平方の誤差
S2(b)係数の分散共分散行列

予測区間

予測区間は、新しい観測値の適合応答が含まれると予想される範囲です。

計算式

表記

用語説明
s(予測変数)
任意の予測値の適合応答値
α有意水準
n観測値数
pモデルのパラメータ数
s 2誤差の平均平方
X予測変数の行列
X01列とp行を持つ、任意の予測変数値のベクトル
X'01行とp列を持つ、予測変数値の新しいベクトルの転置