분산-공분산 행렬의 정의

분산-공분산 행렬은 여러 변수와 관련된 분산과 공분산을 포함하는 정방형 행렬입니다. 행렬의 대각선 원소는 각 변수의 분산을 포함하며, 대각선 이외의 원소는 가능한 모든 변수 쌍 간의 공분산을 포함합니다.

예를 들어, 세 변수 X, Y, Z의 분산-공분산 행렬을 생성할 수 있습니다. 다음 표에서 분산은 대각선을 따라 굵게 표시됩니다. X, Y, Z의 분산은 각각 2.0, 3.4, 0.82입니다. X와 Y의 공분산은 -0.86입니다.
  X Y Z
X 2.0 -0.86 -0.15
Y -0.86 3.4 0.48
Z -0.15 0.48 0.82

X와 Y 사이의 공분산은 Y와 X 사이의 공분산과 같기 때문에 분산-공분산 행렬은 대칭입니다. 따라서 각 변수 쌍의 공분산은 행렬에서 두 번씩 나타납니다. i번째 변수와 j번째 변수 사이의 공분산은 (i, j)와 (j, i) 위치에 표시됩니다.

많은 통계 프로그램에서 통계 모형의 모수 추정기에 대해 분산-공분산 행렬을 계산합니다. 분산-공분산 행렬은 추정기의 표준 오차 또는 추정기의 함수를 계산하는 데 자주 사용됩니다. 예를 들어, 로지스틱 회귀 분석에서는 추정된 계수의 분산-공분산 행렬을 생성하여 계수의 분산과 가능한 모든 계수 쌍 간의 공분산을 확인할 수 있습니다.
참고

대부분의 통계 분석의 경우 열에 결측값이 존재하면 Minitab에서는 상관 또는 공분산 행렬을 계산할 때 전체 행을 무시합니다. 그러나 공분산만 계산할 때는 결측값이 있어도 전체 행을 무시하지 않습니다. 공분산 행렬만 구하려면 통계분석 > 기초 통계 > 공분산 분석을 선택하십시오.