단계적 회귀 분석의 정의

단계적 회귀 분석은 예측 변수의 유용한 부분 집합을 식별하기 위해 모형 구축의 탐색 단계에서 사용되는 자동화된 도구입니다. 공정에서는 체계적으로 각 단계 중에 가장 유의한 변수를 추가하거나 가장 유의하지 않은 변수를 제거합니다.

예를 들어, 주택 공급 시장 컨설팅 회사가 미래의 판매 가격을 예측하기 위해 작년의 주택 판매에 대한 데이터를 수집합니다. 100개보다 많은 예측 변수를 사용하여 모형을 찾는 것은 시간이 많이 걸리는 작업일 수 있습니다. Minitab의 단계적 회귀 분석 기능은 고려할 모형의 순서를 자동으로 식별합니다. AICc, BIC, R2, 수정 R2, 예측 R2, S, Mallows의 Cp와 같은 통계량은 모형을 비교하는 데 도움이 됩니다. Minitab에서는 사용되는 단계적 절차에 따라 가장 적합한 모형에 대한 전체 결과를 표시합니다.

일반적인 단계적 회귀 분석 절차

  • 표준 단계적 회귀 분석에서는 각 단계의 필요에 따라 예측 변수를 추가 및 제거합니다. 모형에 없는 모든 변수가 지정된 입력할 변수에 대한 알파 값보다 큰 p-값을 갖고 있는 경우 그리고 모형의 모든 변수가 지정된 제거할 변수에 대한 알파 값보다 작거나 같은 p-값을 갖고 있는 경우 Minitab이 중지됩니다.
  • 전진 정보 기준 선택은 빈 모형으로 시작되고 Minitab은 각 단계에서 p-값이 가장 작은 항을 추가합니다. 모형이 모든 자유도를 사용하거나 추가할 항이 없으면 절차가 중단됩니다. Minitab에서는 절차에 대해 선택된 정보 기준의 값이 가장 작은 모형에 대한 결과를 표시합니다. 이 정보 기준은 AICc 또는 BIC입니다. 마지막 단계의 최대 모형은 기준의 값이 가장 작지 않아도 됩니다.
  • 전진 선택이 빈 모형으로 시작되고 Minitab은 각 단계에 대한 가장 유의한 항을 추가합니다. 모형에 없는 모든 변수가 지정된 입력할 변수에 대한 알파 값보다 큰 p-값을 갖고 있는 경우 Minitab이 중지됩니다.
  • 후진 제거가 모형에 있는 모든 예측 변수로 시작되고 Minitab은 각 단계에 대한 가장 유의하지 않은 변수를 제거합니다. 모형에 없는 모든 변수가 지정된 제거할 변수에 대한 알파 값보다 작거나 같은 p-값을 갖고 있는 경우 Minitab이 중지됩니다.

단계적 회귀 분석의 문제

  • 2개의 예측 변수가 서로 높은 상관 관계를 갖고 있는 경우 두 변수가 중요하더라도 하나의 변수만 모형에 존재할 수 있습니다.
  • 절차는 많은 모형에 적합하기 때문에 데이터에 적합한 절차가 우연히 선택될 수 있습니다.
  • 단계적 회귀 분석이 지정된 예측 변수 집합에 대해 가장 적합한 기준 값을 가진 모형으로 항상 끝나지 않을 수도 있습니다.
  • 자동 절차에서는 분석가가 해당 데이터에 대해 가질 수 있는 특별한 정보를 고려할 수 없습니다. 따라서 선택된 모형이 실제적인 관점에서는 최상이 아닐 수도 있습니다.
이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오