평활기 선의 정의

평활기 선은 두 변수 사이의 잠재적인 관계를 조사하기 위해 회귀선이나 이론적 분포 등 특정 모형에 적합시키지 않고 데이터에 적합시키는 선입니다. 평활기 선은 관계의 곡면성이 급격하게 변하지 않을 때 가장 유용합니다. 그래프에 추가되는 평활기 선은 Lowess 평활 방식을 사용하여 계산합니다.

평활기 선이 있는 산점도
각 그룹별 평활기 선이 표시된 시계열도

평활기 선 하나는 실선이고 다른 하나의 평활기 선은 점선입니다.

Lowess 평활 방식의 정의

Lowess 평활 방식은 평활기 선을 결정하는 데 널리 사용되는 기술입니다. Lowess는 로컬 가중 산점도 평활기 선(locally-weighted scatterplot smoother)을 의미합니다. 이 루틴은 (x, y) 점의 양쪽에 있는 x-값에 있어 가장 가까운 데이터를 사용하여 모든 점의 부분(기본값 f = 0.5)을 선택합니다. Minitab은 각 데이터 점에 대해 가중 선형 회귀 분석을 수행하고 각 x-값에 가장 가까운 점에 가장 큰 평활화 가중치를 부여하고 특이치의 영향을 제한합니다. 평활화 정도와 특이치의 영향을 모두 수정하기 위해 모수를 지정할 수 있습니다. 평활화 모수의 가중치도 지정할 수 있습니다. 가중치가 클수록 평활된 값이 데이터 패턴을 더 따르고, 가중치가 작을수록 평활된 값의 패턴에서 들쭉날쭉한 정도가 더 작아집니다.

그래프에 평활기 선 추가

산점도, 산점도 행렬, 히스토그램 및 시계열도에 Lowess 평활기 선을 추가할 수 있습니다.

  1. 그래프에서 마우스 오른쪽 단추를 클릭한 다음 추가 > 평활기을 선택합니다.
  2. (선택 사항) 평활도에 각 x-값에서 적합치를 계산하는 데 사용할 전체 점 개수의 비율(0과 1 사이의 숫자)을 입력합니다. 기본값은 0.5입니다.
  3. (선택 사항) 단계 수에 특이치의 영향력을 제한하기 위해 사용되는 평활의 반복 횟수를 지정할 숫자(0~10)를 입력합니다. 각 단계는 다음 반복 과정에서 특이치에 주어지는 가중치를 줄입니다. 기본값은 2입니다.
  4. 확인을 클릭합니다.

Lowess 방법

Lowess 루틴에서는 각 x-값에 대한 평활된 새 y-값을 계산합니다.

  1. 이 루틴은 (x,y) 점의 양쪽에 있는 x-값에 있어 가장 가까운 데이터를 사용하여 모든 점의 부분(기본값 f = 0.5)을 선택합니다. 이 방법을 선택하면 x-값을 기준으로 한 쪽의 점이 다른 쪽의 점보다 더 많이 선택될 수도 있습니다. 다음 예에서는 특정 점에 대해 선택된 데이터를 보여줍니다. 음영 영역에는 채워진 빨간색 데이터 점 가까이에 0.5가 있습니다.

  2. Minitab에서는 선택된 부분의 각 점과 평활될 점 사이의 x-거리를 사용하여 가중치를 계산합니다.

    다음 그래프는 선택된 점들의 부분에 대한 가중치(세로축)와 x-값(가로축) 사이의 관계를 보여줍니다. 각 x-값에 가장 가까운 점은 평활에서 가장 큰 가중치를 갖습니다.

  3. Minitab은 초기 평활된 값을 생성하는 2단계에서 계산된 가중치를 사용하여 선택된 부분에 있는 모든 점에 대해 가중 선형 회귀를 수행합니다.

  4. 마지막으로 Minitab은 다음 방정식으로 얻은 새 가중치를 사용하여 반복한 3단계(기본 n = 2)를 통해 결과에 대한 특이치의 영향을 제한합니다. 이러한 단계를 "로버스트 단계"라고 합니다.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오