偏最小二乗回帰のX-統計量およびY-統計量

X-統計量およびY-統計量表のすべての統計量の定義と解釈について解説します。

X-計算値

X-計算値はX-スコアの線形の組み合わせです。X-計算値には、PLS回帰モデルによって説明される、項の分散が含まれます。比較的小さなX-計算値を持つ観測値は、X-空間の外れ値であり、モデルによって良好に説明されません。

X-計算行列は、元のX-行列と同様に、n × pの行列(nは観測値の数、pは項の数)です。X-計算値のスケールは、予測変数と同じです。

成分の数が項の数と同じならば、X-計算値は元のX-値と等しくなります。

X-因子負荷量

X-因子負荷量は、項をX-スコアに関連付ける線形係数です。X-因子負荷量は、m番目の成分に対応する項の重要度を示します。X-因子負荷量は、主成分分析の固有ベクトルに似ており、p × m行列(pは項の数、mは成分の数)を形成します。

X-残差

X-残差には、PLS回帰モデルによって説明されない、予測変数の分散が含まれます。比較的大きなX-残差を持つ観測値は、X-空間の外れ値であり、モデルによって良好に説明されないことを示します。

X-残差は、各項の実際の値とX-計算値との差であり、スケールは元の予測変数と同じです。X-残差行列は、元のX-行列と同様に、n × pの行列(nは観測値の数、pは項の数)です。

X-スコア

X-スコアはモデル内の項の線形の組み合わせです。X-スコアは、主成分スコアに似ており、無相関列のn × mの行列(nは観測値の数、mは成分の数)を形成します。X-スコアは、PLS回帰成分に対する観測値の射影です。PLS回帰は、最小二乗推定を使用して、モデル内の元の項の代わりにX-スコアを適合させます。

X-分散

X-分散は、モデルによって説明される項における予測変数の分散量です。X-分散は0~1の値です。

X-分散の値が1に近いほど、成分は元の項を良好に表します。複数の応答がある場合、X-分散値はすべての応答で同じです。

X-重み

X-重みは予測変数と応答の間の共分散を示します。アルゴリズムでは、X-重みを使用して、X-スコアが直交型であること、つまり互いに関係を持たないことを確認します。X-重みは、X-スコアの計算に使用されるもので、p × mの行列(pは項の数、mは成分の数)を形成します。

Y-計算値

Y-計算値はX-スコアの線形の組み合わせです。Y-計算値には、PLSモデルによって説明される、応答の分散が含まれます。比較的小さなY-計算値を持つ観測値は、Y-空間の外れ値であり、モデルによって良好に説明されません。

Y-計算行列は、元のY-行列と同様に、n × rの行列(nは観測値の数、rは応答の数)です。Y-計算値のスケールは、応答と同じです。

Y-因子負荷量

Y-因子負荷量は、応答をY-スコアに関連付ける線形係数です。Y-因子負荷量は、m番目の成分に対応する応答の重要度を示します。Y-因子負荷量は、r × mの行列(rは応答の数、mは成分の数)を形成します。

Y-残差

Y-残差には、PLS回帰モデルによって説明されない、応答の残りの分散が含まれます。比較的大きなY-残差を持つ観測値は、Y-空間の外れ値であり、モデルによって良好に説明されないことを示します。

Y-残差は、実際の応答値とY-計算値との差であり、スケールは元の応答と同じです。Y-残差行列は、元のY-行列と同様に、n × rの行列(nは観測値の数、rは応答の数)です。

Y-スコア

Y-スコアは応答変数の線形の組み合わせです。Y-スコアは、n × mの行列(nは観測値の数、mは成分の数)を形成します。Y-スコアは、PLS回帰成分に対する観測値の射影です。