가중 회귀 분석의 정의

가중 회귀 분석은 잔차의 분산이 일정하다는 최소 제곱법 가정이 어긋나는 경우(이분산성) 사용할 수 있는 방법입니다. 이 절차는 올바른 가중치를 사용하여 가중된 잔차 제곱합을 최소화함으로써 분산이 일정한(동분산성) 잔차를 만들어냅니다.

중요

생략된 변수에 의해 이분산성이 유발되는 경우 가중 회귀 분석은 적절한 해결 방법이 아닙니다.

사용할 가중치 선택에 대한 정보

올바른 가중치를 결정하는 일은 까다로운 작업이 될 수 있습니다. 이상적인 가중치는 오차 분산의 역수입니다. 그러나 이 값은 대부분 계산이 불가능하기 때문에 다른 방법을 사용해야 합니다. 다음과 같은 방법을 사용할 수 있습니다.
  • 분산이 예측 변수에 비례하는 경우, 예측 변수 또는 예측 변수 제곱의 역수. 어떤 방법이 가능한지 확인하기 위해 시행착오를 거치고 경험을 활용해야 할 수도 있습니다.
  • 이론이나 문헌, 이전 연구를 바탕으로 한 값

일반적으로 분산이 작은 관측치에는 상대적으로 큰 가중치가 부여되고 분산이 큰 관측치에는 상대적으로 작은 가중치가 부여됩니다.

여러 도시의 연간 교통 사고 횟수를 예측하는 회귀 분석 모형이 있다고 가정합시다. 인구가 많은 도시일수록 사고가 더 많기 때문에 대도시일수록 잔차도 더 커지는 경향이 있습니다. 이 문제를 해결하는 한 가지 방법은 각 도시 인구의 역수를 가중치로 사용하는 것입니다.

가중치는 자유도에 영향을 미치지 않음

가중치 열을 지정해도 하나 이상의 관측치에 0의 가중치를 제공하지 않으면 자유도에 영향을 미치지 않습니다. 관측치에 가중치 0을 부여하면 관측치가 분석에서 제거되며, 따라서 자유도가 감소합니다.

가중치 열을 지정하면 제곱합과 모수 추정치에 다음과 같은 방식으로 영향을 미칩니다.
  • 제곱합이 가중 제곱합이 됩니다.
  • 가중 평균이 총 제곱합에 사용됩니다.
  • 가중 최소 제곱 기준이 모수 추정치 계산에 사용됩니다.

가중 선형 회귀 분석을 위해 적합선 그림 생성

다음 단계를 통해 생성되는 그래프에는 통계분석 > 회귀 분석 > 적합선 그림을 사용하여 생성된 적합선 그림처럼 회귀 방정식, s, R-제곱 및 수정된 R-제곱(수정)이 포함되지 않습니다. 그러나 Minitab에서는 이 정보를 결과에 표시하고 사용자가 이 정보를 복사하여 그래프에 붙여넣을 수 있습니다.

C1에 반응, C2에 예측 변수, C3에 가중치가 있다고 가정합니다.

  1. 통계분석 > 회귀 분석 > 회귀 분석 > 적합 회귀 모형을 선택합니다.
  2. 반응C1를 입력합니다. 계량형 예측 변수C2를 입력합니다.
  3. 옵션을(를) 클릭합니다.
  4. 가중치C3를 입력합니다. 확인을(를) 클릭합니다.
  5. 저장을(를) 클릭합니다.
  6. 적합치을(를) 선택합니다.
  7. 각 대화 상자에서 확인을 클릭합니다.
  8. 그래프 > 산점도을 선택합니다.
  9. 단순을(를) 클릭합니다. 확인을(를) 클릭합니다.
  10. Y 변수C1를 입력합니다.
  11. X 변수C2를 입력합니다. 확인을(를) 클릭합니다.
  12. 산점도에서 마우스 오른쪽 단추를 클릭하고 추가 > 계산된 선을 선택합니다.
  13. Y 열에 적합치의 열(보통 FITS1)을 입력합니다.
  14. X 열C2를 입력합니다. 확인을(를) 클릭합니다.

선 색상 및 그래프 제목 편집

선의 색상을 변경할 수 있습니다. 선을 파란색으로 지정하려면 선을 두 번 클릭합니다. 속성 탭의 에서 사용자 정의를 선택하고 색상 드롭다운 리스트에서 파랑을 선택합니다. 확인을(를) 클릭합니다.

제목도 변경할 수 있습니다. 제목을 두 번 클릭합니다. 글꼴 탭의 텍스트에 원하는 제목을 입력합니다. 확인을(를) 클릭합니다.