偏最小二乗回帰の適合値と残差を求める方法と計算式

目的の方法または計算式を選択してください。

このトピックの内容

適合値
交差検証された適合値
残差
交差検証された残差
標準化残差（Std Resid）
適合値の標準誤差（SE Fit）
信頼区間
予測区間

適合値

予測されたYまたはは、推定回帰式を使用して得られた予測変数値の平均応答値です。

交差検証された適合値

交差検証された適合値は、モデルがどの程度データを予測するかを示します。これらの値は、モデルのデータへの適合度を示す通常の適合値と同様です。観測値の交差検証された適合値を得るには、モデルを計算するために使用したデータからその値を削除する必要があり、それによって、適合値は、観測値から独立している係数ベクトルと共に計算されます。交差検証された適合値の計算式は以下の通りです。

表記

用語	説明
\i	i観測値がモデル計算から除外されたことを示します。
b_0\i	観測値iに含まれないモデルの切片
X	予測変数値
B_{(\i)(j, k)}	観測値iに含まれないモデルの係数

残差

残差とは、観測値とそれに対応する適合値の差です。観測値のこの部分はモデルでは説明ができません。観測値の残差は以下になります。

表記

用語	説明
y_i	i番目に観測された応答値
	i番目の応答適合値

交差検証された残差

交差検証された残差はモデルの予測能力を示し、PRESS統計量を計算する際に使用されます。PLSの交差検証残差と最小二乗回帰の考え方は似ていますが、計算方法が異なります。

計算式

PLSの場合、交差検証された残差は、実際の応答と交差検証された適合値との差です。

交差検証された残差値は、交差検証の過程でモデルが再計算されるたびに除外される観測値の数に応じて異なります。

最小二乗回帰では、交差検証残差は通常の残差から直接計算されます。

表記

用語	説明
(i)	モデル計算から除外された観測値
y_i	応答値
	交差検証された適合値

標準化残差（Std Resid）

標準化残差は、「内部的スチューデント化残差」とも呼ばれます。

計算式

表記

用語	説明
e_i	i番目の残差
h_i	X(X'X)^–1X'のi番目の対角要素
s²	誤差の平均平方
X	計画行列
X'	計画行列の転置

適合値の標準誤差（SE Fit）

1つの予測変数を持つ回帰モデルにおける適合値の標準誤差：

2つ以上の予測変数を持つ回帰モデルにおける適合値の標準誤差：

重み付け回帰の場合、式に重み行列を含めます。

データにテストデータセットまたは K 折りクロス検証がある場合、数式は同じです。の値 s²はトレーニングデータから。設計マトリックスと重量マトリックスもトレーニングデータから取得されます。

表記

用語	説明
s¹	mean square error
n	number of observations
x₀	new value of the predictor
	mean of the predictor
x_ii	i^番目の predictor value
x₀	vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x 2」と定義されます。₀	transpose of the new vector of predictor values
X	design matrix
W	weight matrix

信頼区間

信頼区間は、特定の予測値のセットに対して推定された平均応答値が含まれると予測される範囲です。この区間は、信頼水準と適合値の標準誤差から計算される下限と上限によって定義されます。

計算式

表記

用語	説明
α	α値
n	観測値数
p	予測変数の数

s²	平均平方の誤差
S²(b)	係数の分散共分散行列

予測区間

予測区間は、新しい観測値の適合応答が含まれると予想される範囲です。

計算式

表記

用語	説明
s(予測変数)
	任意の予測値の適合応答値
α	有意水準
n	観測値数
p	モデルのパラメータ数
s ²	誤差の平均平方
X	予測変数の行列
X₀	1列とp行を持つ、任意の予測変数値のベクトル
X'₀	1行とp列を持つ、予測変数値の新しいベクトルの転置