偏最小二乗回帰の方法

使用する方法を選択します。

モデルの当てはめ

Minitabは、Herman Wold1PLSは、予測変数と応答変数の間の共分散に基づいて、無相関の成分を抽出することで、予測変数の数を減らします。PLSは主成分回帰やリッジ回帰に似ていますが、計算方法が異なります。

PLSアルゴリズによって一連のモデルが生成され、連続する各モデルには成分が1つ追加されます。成分は1つずつ計算され、まず、標準化されたX-行列とY-行列から始まります。後続の成分は、X-残差行列とY-残差行列を元に計算され、反復は、成分の最大数に達したとき、またはX-残差がゼロ行列になったときに停止します。成分数が予測変数の数と等しい場合、PLSモデルは最小二乗回帰モデルと等しくなります。交差検証は、予測誤差を最小化する成分数を特定するために使用します。

PLSは、予測変数と応答に対する分解を両方同時に行います。成分数が判断され、負荷量が計算されると、各予測変数の回帰係数を計算します。PLSとNIPALSの詳細については、以下を参照してください。234

交差検証

潜在的なモデルの予測能力を計算するため、モデルに含める成分の適切な数を決定する際に便利です。データに複数の応答変数がある場合、Minitabでは、すべての応答に対して同時に成分の妥当性が確認されます。

交差検証の手順

Minitabでは、個々の潜在的なモデルに対して次の処理を実行します。

  1. 使用する交差検証手法に応じて、1つの観測値または観測値のグループを除外します。
  2. その観測値または観測値のグループを省略したまま、モデルを再計算します。
  3. 再計算したモデルを使用して、省略された観測値または観測値グループの応答、つまり交差検証された適合値を予測し、交差検証された残差値を計算します。
  4. すべての観測値が除外され、適合されるまで、手順1~3を繰り返します。
  5. 予測の平方和(PRESS)と予測R2の値を計算します。

各モデルに対して手順1~5を実行した後、予測R2が最大でPRESSが最小になる成分数のモデルが選択されます。複数の応答変数がある場合は、平均予測R2が最大で平均PRESSが最小になるモデルが選択されます。

1 H. Wold(1975)により開発された、非線形反復偏最小二乗(NIPALS、Nonlinear Iterative Partial Least Squares)アルゴリズムを使用しています。適切に条件付けられていないデータに関する問題を解決するために、Probability and Statistics, Papers in Honour of M.S. Bartlett(J. Gani編、Academic Press)では、"Soft Modeling by Latent Variables; the Nonlinear Iterative Partial Least Squares Approach"という見方が記されています。
2 P. Geladi、B. Kowalski(1986)、『Partial Least-Squares Regression: A Tutorial』Analytica Chimica Acta第185号、1-17頁
3 A. Hoskuldsson(1988)、『PLS Regression Methods』Journal of Chemometrics第2号、211-228頁
4 A. Lorber、L. Wangen、B. Kowalski(1987)、『A Theoretical Foundation for the PLS Algorithm』Journal of Chemometrics第1号、19-31頁