평활기 선은 두 변수 사이의 잠재적인 관계를 조사하기 위해 회귀선이나 이론적 분포 등 특정 모형에 적합시키지 않고 데이터에 적합시키는 선입니다.

평활기 선 정보

평활기 선은 관계의 곡면성이 급격하게 변하지 않을 때 가장 유용합니다. 그래프에 추가되는 평활기 선은 Lowess 평활 방식을 사용하여 계산합니다.

평활기 선이 있는 산점도

이 시계열도에서 평활기 선 하나는 실선이고 다른 평활기 선은 점선입니다.

각 그룹별 평활기 선이 표시된 시계열도
Lowess 평활화 모수
평활도
0과 1 사이의 값을 입력할 수 있습니다. Lowness 평활기는 일반적으로 f 값이 변수 간의 내재되어 있는 관계를 왜곡시키지 않는 한도에서 평활된 적합을 나타내기에 충분히 클 경우 효과적입니다. Cleveland1은 f를 가능한 크게 하고 y-값 잔차 대 x-값의 개별 Lowess 그림에서는 무관성을 유지하는 것이 좋다고 합니다.
단계 수
평활된 y-값에 대한 특이치의 영향력을 제한하려면 평활의 반복 횟수를 설정합니다. 0에서 10까지의 값을 입력할 수 있습니다. 각 단계에서는 이전 Lowess 단계에서 얻은 잔차의 크기를 기초로 하여 가중 선형 회귀의 다음 반복 과정에서 특이치에 주어지는 가중치를 줄입니다. Cleveland는 대부분의 데이터에 대한 특이치 효과를 올바르게 평활하는 두 가지 로버스트(Robust) 단계를 제안합니다

그래프를 생성할 때 평활기 선 추가

다음 그래프 중 하나를 만들 때 평활기 선을 추가하려면 다음 단계를 수행하십시오.
  • 산점도
  • 산점도 행렬
  • 시계열도
  • 히스토그램
  1. 그래프 생성 대화 상자에서 데이터 보기을 클릭합니다.
  2. 평활기을(를) 클릭합니다.
  3. Lowess을(를) 클릭합니다.
  4. (선택 사항) 평활도에 각 x-값에서 적합치를 계산하는 데 사용할 전체 점 개수의 비율(0과 1 사이의 숫자)을 입력합니다. 기본값은 0.5입니다. 평활 정도가 작을수록 평활기가 데이터의 더 작은 패턴을 따르는 경향이 있습니다. 평활 정도가 클수록 평활기가 데이터의 전체 패턴을 따르는 경향이 있습니다.
  5. (선택 사항) 단계 수에 특이치의 영향력을 제한하기 위해 사용되는 평활의 반복 횟수를 지정할 숫자(0~10)를 입력합니다. 각 단계는 다음 반복 과정에서 특이치에 주어지는 가중치를 줄입니다. 기본값은 2입니다.
  6. 확인을(를) 클릭합니다.

그래프에 평활기 선 추가

산점도, 산점도 행렬, 히스토그램 및 시계열도에 Lowess 평활기 선을 추가할 수 있습니다.

  1. 그래프를 두 번 클릭합니다.
  2. 그래프에서 마우스 오른쪽 단추를 클릭한 다음 추가 > 평활기을 선택합니다.
  3. (선택 사항) 평활도에 각 x-값에서 적합치를 계산하는 데 사용할 전체 점 개수의 비율(0과 1 사이의 숫자)을 입력합니다. 기본값은 0.5입니다. 평활 정도가 작을수록 평활기가 데이터의 더 작은 패턴을 따르는 경향이 있습니다. 평활 정도가 클수록 평활기가 데이터의 전체 패턴을 따르는 경향이 있습니다.
  4. (선택 사항) 단계 수에 특이치의 영향력을 제한하기 위해 사용되는 평활의 반복 횟수를 지정할 숫자(0~10)를 입력합니다. 각 단계는 다음 반복 과정에서 특이치에 주어지는 가중치를 줄입니다. 기본값은 2입니다.
  5. 확인을(를) 클릭합니다.

그래프의 평활기 선 편집

그래프에 평활기 선에 추가된 후 평활기 선의 색상, 크기, 유형 또는 매개변수를 변경할 수 있습니다.

  1. 그래프를 두 번 클릭합니다.
  2. 편집할 평활기 선을 두 번 클릭합니다. 평활기 선 선택에 대한 자세한 내용은 그래프에서 그룹 및 단일 항목 선택에서 확인하십시오.
  3. 편집하려는 탭을 선택합니다.
    • 속성: 선의 색상, 크기 및 유형을 변경합니다.
    • 그룹: 그룹화 변수와 함께 속성을 할당합니다.
    • 옵션: 평활의 정도와 평활기의 단계 수를 변경합니다.
  4. 확인을(를) 클릭합니다.

Lowess 방법

Lowess 평활 방식은 평활기 선을 결정하는 데 널리 사용되는 기술입니다. Lowess는 로컬 가중 산점도 평활기 선(locally-weighted scatterplot smoother)을 의미합니다. 평활화 정도와 특이치의 영향을 모두 수정하기 위해 모수를 지정할 수 있습니다.

Lowess 루틴에서는 각 x-값에 대한 평활된 새 y-값을 계산합니다.

  1. 이 루틴은 (x,y) 점의 양쪽에 있는 x-값에서 가장 가까운 데이터를 사용하여 모든 점의 부분(기본값 f = 0.5)을 선택합니다. 이 부분을 평활의 정도라고 합니다. 이 방법을 선택하면 x-값을 기준으로 한 쪽의 점이 다른 쪽의 점보다 더 많이 선택될 수도 있습니다. 다음 예에서는 특정 점에 대해 선택된 데이터를 보여줍니다. 음영 영역에는 채워진 빨간색 데이터 점 가까이에 0.5가 있습니다.

  2. Minitab에서는 선택된 부분의 각 점과 평활할 점 사이의 x 거리를 사용하여 가중치를 계산합니다.

    다음 그래프는 선택된 점들의 부분에 대한 가중치(세로축)와 x-값(가로축) 사이의 관계를 보여줍니다. 각 x-값에 가장 가까운 점은 평활에서 가장 큰 가중치를 갖습니다.

  3. Minitab은 초기 평활된 값을 생성하는 2단계에서 계산된 가중치를 사용하여 선택된 부분에 있는 모든 점에 대해 가중 선형 회귀를 수행합니다.

  4. 마지막으로 Minitab은 다음 방정식으로 얻은 새 가중치를 사용하여 반복한 3단계(기본 n = 2)를 통해 결과에 대한 특이치의 영향을 제한합니다.

1 W.S. Cleveland (1979). "Robust locally weighted regression and smoothing scatterplots," Journal of the American Statistical Association, 74, 829-836