偏最小二乗回帰のモデル選択の方法と計算式

目的の方法または計算式を選択してください。

R二乗

R2は、決定係数とも言います。

計算式

表記

用語説明
yi i番目の観測された応答値
平均応答
i番目の適合された応答

平方和(SS)

平方距離の和。平方和回帰は、モデルで説明される変動量の一部です。平方和誤差は、モデルで説明されない部分であり、誤差に起因します。平方和の合計は、データの変動量の合計です。

計算式

平方和回帰:
平方和誤差:
全体平方和:

表記

用語説明
yii番目の観測反応値
i番目の適合された応答
平均応答

PRESS

予測平方和(PRESS)統計量はモデルの予測能力を評価します。PRESSは、残差平方和に似ており、予測誤差の平方和です。PLSでは、モデルを交差検証する場合にのみPRESSを計算します。

以下のステップでPRESS計算します。

  1. モデルは、観測値の数と同じ回数だけ再計算され、計算の度に異なる観測値を除外します。それぞれで省略された観測値に対して、Minitabでは、モデルを使用して適合または予測された応答を計算します。
  2. 観測された応答値から予測値を引きます。観測適合値はモデルから独立しているため、これが正しい予測誤差になります。
  3. Minitabでは、すべての観測値に対してこの手順が実行され、以下の計算式を使用してPRESSが計算されます。

一般に、PRESSが小さいほど、モデルの適合度は上がります。PRESSは、予測R2を計算するときに使用します。

表記

用語説明
yi観測された応答値
除外された観測値の適合応答
n観測値数

R二乗(予測)

R2(予測)値に負値が算出される場合がありますが、Minitabでは0を表示します。

表記

用語説明
yi i番目の観測された応答値
平均応答
n 観測値数
ei i番目の残差
hi X(X'X)–1X'i番目の対角要素
X計画行列

検定R二乗

PLSモデルによって検定データをどの程度予測できるかを示します。検定R2は、応答の変動のうち、検定データセット内の予測変数によって説明される部分を表します。一般に、適合するモデルの検証には検定データを使用しますが、この検定データには元のデータセットと同じ数の予測変数が含まれている必要があります。検定R2は、検定データに各観測値の応答データが含まれている場合にのみ計算できます。検定R2を計算する方法は、以下の計算式を持つR2と同じです。