최량 부분 집합 회귀 분석 및 단계적 회귀 분석 사용

최량 부분 집합 회귀 분석 및 단계적 회귀 분석의 비교

최량 부분 집합 회귀 분석에서는 여러 가지 모형의 적합에 대한 정보를 제공하므로 네 가지 개별 통계량을 기초로 모형을 선택할 수 있습니다. 단계적 회귀 분석에서는 통계량 하나를 기초로 하나의 모형을 만듭니다. 모형마다 다른 선택 기준이 사용되기 때문에 최량 부분 집합 회귀 분석과 단계적 회귀 분석에서 각기 다른 모형을 선택하게 될 수도 있습니다. 사용할 방법을 선택하기 위한 일반적인 지침은 다음과 같습니다.
  • 예측 변수가 적은 데이터 집합의 경우, 최량 부분 집합 회귀 분석이 더 많은 모형에 대한 정보를 제공하기 때문에 단계적 회귀 분석보다 유용합니다.
  • 최량 부분 집합의 경우 31개의 자유 예측 변수만을 가질 수 있기 때문에, 예측 변수가 많은 데이터 집합의 경우 단계적 회귀 분석이 최량 부분 집합 회귀 분석보다 더 좋습니다. 예측 변수가 많은 데이터 집합에서 단계적 회귀 분석을 사용할 때는 입력할 변수에 대한 유의 수준과 제거할 변수에 대한 유의 수준을 큰 값(0.25에서 0.50)으로 선택해야 합니다. 이렇게 하면 입력된 각 예측 변수의 반응 변수에 미치는 영향과 모형에 이미 포함된 예측 변수에 미치는 영향에 대한 많은 정보를 얻을 수 있습니다.

모형 확인

최량 부분 집합 회귀 분석 및 단계적 회귀 분석과 같은 변수 선택 절차를 사용할 때는 주의를 기울여야 합니다. 이러한 절차는 자동으로 수행되므로 예측 변수들의 실제적인 중요성이 고려되지 않습니다. 또한 데이터에 모형을 적합할 때 적합도는 다음의 기본적인 두 가지 사항으로부터 얻습니다.
  • 데이터의 기본적인 구조(같은 방식으로 수집된 다른 데이터 집합에 적용되는 구조)
  • 분석하는 특정 데이터 집합의 특성

모형이 하나의 특정 데이터 집합만 적합하지 않도록 새 데이터 집합에 대한 선택 절차에서 발견된 모형을 확인해야 합니다. 처음에 얻은 데이터 집합을 랜덤하게 두 부분으로 나눈 다음 한 부분에서 최량 부분 집합을 사용하여 모형을 선택하고 다른 부분에서는 적합성을 확인할 수도 있습니다. 이렇게 하면 선택한 모형이 같은 방식으로 수집된 다른 데이터 집합에도 적용됩니다.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오