偏最小二乗回帰のてこ比と距離

てこ比および距離のすべての統計量の定義と解釈について解説します。

てこ比

てこ比は、異常、または離れたX-値を持つ観測値を識別します。てこ比が高い観測値は、X-スコアがゼロから大きく離れており、回帰係数に大きな影響を与える可能性があります。高いてこ比を持つ点は、Y-空間で必ずしも外れ値ではありません。2m/nより大きなてこ比を持つ観測値(mは成分数、nは観測値数)を調べることをお勧めします。

距離Y

Y-モデルからの距離は、観測値がY-空間にどの程度良好に適合するかを示します。Y-モデルからの距離は、観測値がY-スコアによってどの程度良好に記述されるかを特定します。大きな距離値を持つ観測値は、外れ値である可能性もあります。

距離X

X-モデルからの距離は、観測値がX-空間にどの程度良好に適合するかを示します。X-モデルからの距離は、観測値がX-スコアによってどの程度良好に記述されるかを特定します。大きな距離値を持つ観測値は、てこ比点である可能性もあります。