부분 최소 제곱법의 정의

부분 최소 제곱법(PLS)은 원본 데이터 대신 상관 관계가 없는 성분 집합으로 예측 변수를 줄이고 이러한 성분에서 최소 제곱법을 수행하는 방법입니다. 부분 최소 제곱법은 예측 변수가 매우 공선적이거나 예측 변수의 수가 관측치의 수보다 많으며 범용 최소 제곱법에서 계수를 생성하지 못하거나 표준 오차가 높은 계수를 생성할 경우에 특히 유용합니다. PLS에서는 다중 회귀 분석과 달리 예측 변수가 고정되어 있다고 가정하지 않습니다. 즉, 예측 변수를 측정할 때 오류가 발생할 수 있지만 불확실성을 측정하는 데 더 로버스트합니다.

PLS는 주로 화학, 약품, 식품 및 플라스틱 산업에 사용됩니다. PLS는 서로 상관 관계를 갖고 있는 많은 변수가 포함되는 분광 측정(NIR, IR, UV) 및 화학 성분 또는 기타 물리 화학 속성 사이의 관계를 모형화하는 데 일반적으로 사용됩니다. PLS에서는 예측 모형을 개발하는 데 중요성을 부여합니다. 따라서 PLS는 대부분 반응을 설명하는 데 유용하지 않은 변수를 제거하는 데 사용하지 않습니다.

PLS를 수행하기 위해 Minitab에서는 Herman Wold가 개발한 비선형 반복 부분 최소 제곱(NIPALS) 알고리즘을 사용합니다. 이 알고리즘에서는 예측 변수와 반응 변수 간의 최대 상관을 설명하는 일련의 성분을 추출하기 위해 주성분 분석과 유사한 기술을 사용하여 예측 변수의 수를 줄입니다. PLS는 예측 변수만큼 성분을 계산할 수 있습니다. 때로 교차 검증을 사용하여 뛰어난 예측 능력을 제공하는 더 작은 성분 집합을 식별합니다. 가능한 모든 성분을 계산할 경우 결과 모형은 최소 제곱법을 사용하여 얻는 모형과 같습니다. PLS에서는 예측 변수와 예측 변수 및 반응 사이에서 분산을 얼마나 잘 설명하는지 근거로 성분이 선택됩니다. 예측 변수가 깊은 상관 관계를 갖고 있거나, 적은 수의 성분으로 완벽하게 반응을 모형화할 경우 PLS 모형의 성분 수가 예측 변수 수보다 훨씬 적을 수 있습니다. 그런 다음 상관 관계가 없는 성분에 대해 최소 제곱법을 수행합니다.

최소 제곱법과 달리 PLS는 단일 모형에 여러 반응 변수를 적합시킬 수 있습니다. PLS 회귀 분석은 여러 반응 변수를 단일 모형에 적합시킵니다. PLS 회귀 분석은 다변량 방식으로 반응 변수들을 모형화하기 때문에 결과는 반응 변수를 개별적으로 고려하여 계산한 것과 크게 다를 수 있습니다. 반응 간에 상관 관계가 없는 경우에만 여러 반응값을 모형화해야 합니다.