선형 판별 분석의 정의

관측치로부터 그룹 중심(평균)까지의 거리 제곱(Mahalanobis 거리라고도 함)이 최소일 경우 해당 관측치는 해당 그룹으로 분류됩니다. 이 때 모든 그룹의 공분산 행렬은 같다고 가정합니다. 각 그룹에 대한 거리 제곱 공식에는 고유한 부분이 있는 데 이런 부분을 해당 그룹에 대한 선형 판별 함수라고 합니다. 모든 관측치에 대해 거리 제곱 값이 가장 작은 그룹이 가장 큰 선형 판별 함수를 가지며 해당 관측치는 이 그룹으로 분류됩니다.

선형 판별 분석에는 거리 제곱이 대칭을 이루는 속성이 있으므로, 그룹 j의 평균을 사용하여 평가된 그룹 i의 선형 판별 함수는 그룹 i의 평균을 사용하여 평가된 그룹 j의 선형 판별 함수와 같습니다.

이는 사전 확률이 없고 공분산 행렬이 같은 가장 단순한 경우입니다. Mahalanobis 거리가 관측치로부터 그룹까지의 거리를 측정하는 적절한 방법인 경우 데이터의 기본적인 분포에 대해 가정할 필요가 없습니다.

Minitab에서는 단일 공통 공분산 행렬을 사용하여 관측치와 등급 간의 Mahalanobis 거리를 계산합니다. 또한 새 관측치를 분류하는 데 사용할 수 있는 선형 판별 함수(회귀 계수와 유사함)를 사용합니다.

참고

공분산 행렬이 모든 그룹에서 같다고 가정하는 경우 선형 분석을 사용합니다. 공분산 행렬이 모든 그룹에서 같지 않다고 가정하는 경우 이차 판별 분석을 사용합니다.