偏最小二乗回帰のモデル情報を求める方法と計算式

目的の方法または計算式を選択してください。

係数と標準化係数

係数は回帰式のパラメータです。推定される係数は、応答変数の適合値と新しい観測の予測応答を計算する際に予測変数と共に使用されます。最小二乗とは対照的に、PLS係数は非線形推定量です。標準化係数はモデル内の各予測変数の重要度を示し、標準化されたX-変数およびY-変数に対応します。PLSでは、係数行列(次元p × r)は、重みと因子負荷量から計算されます。

標準化係数の計算式は以下の通りです。

非標準化係数と切片を計算するには、以下の計算式を使用します。

表記

用語説明
WX-重み行列
PX-因子負荷量の行列
CY-因子負荷量の行列
j予測変数(1,p
k応答(1,r
p予測変数の数
r応答数

てこ比

最小二乗回帰では、てこ比は、対応する観測値がX-空間の中央からどれだけ離れているかを示す値であり、X-値で説明されます。PLSでは、予測変数はX-スコアに置き換えられます。てこ比が高い観測値は、X-スコアがゼロから大きく離れており、回帰係数に大きな影響を与える可能性があります。てこ比が大きい点が、X-空間の外れ値ですが、Y-空間の外れ値であるとは限りません。

PLSのてこ比の値はX-スコア行列Tから算出されます。この行列を使用して、以下のようにハット行列(H)を計算できます。

i番目の観測値のてこ比(hii)は、H行列のi番目の対角要素です。

てこ比は、値が2m / nを上回る場合は高すぎであると考えられ、調査する必要があります。

表記

用語説明
n観測値数
m成分数

X-モデルからの距離

観測値がX-空間にどの程度良好に適合するかという測度は、X-スコアが観測値をどの程度良好に記述するかを示します。大きな距離を持つ観測値は、てこ比点である可能性もあります。

計算式

i番目の観測値に対するX-モデルからの距離を計算する計算式は以下になります。

表記

用語説明
M成分数
tX-スコア
p予測変数の数

Y-モデルからの距離

観測値がY-空間にどの程度良好に適合するかという測度は、Y-スコアが観測値をどの程度良好に記述するかを示します。大きな距離を持つ観測値は、外れ値である可能性もあります。

計算式

i番目の観測値に対するY-モデルからの距離を計算する計算式は以下になります。

表記

用語説明
M成分数
uY-スコア
r応答数