단계적 회귀 분석의 정의

단계적 회귀 분석은 예측 변수의 유용한 부분 집합을 식별하기 위해 모형 구축의 탐색 단계에서 사용되는 자동화된 도구입니다. 공정에서는 체계적으로 각 단계 중에 가장 유의한 변수를 추가하거나 가장 유의하지 않은 변수를 제거합니다.

예를 들어, 주택 공급 시장 컨설팅 회사가 미래의 판매 가격을 예측하기 위해 작년의 주택 판매에 대한 데이터를 수집합니다. 100개보다 많은 예측 변수를 사용하여 가장 유의한 모형을 찾는 것은 시간이 많이 걸리는 작업일 수 있습니다. Minitab의 단계적 회귀 분석 기능은 R2, 수정 R2, 예측 R2, S, Mallows의 Cp와 함께 가장 유의한 모형을 자동으로 표시하여 올바른 시작 점을 제공합니다.

일반적인 단계적 회귀 분석 절차

  • 표준 단계적 회귀 분석에서는 각 단계의 필요에 따라 예측 변수를 추가 및 제거합니다. 모형에 없는 모든 변수가 지정된 입력할 변수에 대한 알파 값보다 큰 p-값을 갖고 있는 경우 그리고 모형의 모든 변수가 지정된 제거할 변수에 대한 알파 값보다 작거나 같은 p-값을 갖고 있는 경우 Minitab이 중지됩니다.
  • Forward selection starts with an empty model and Minitab adds the most significant term for each step. Minitab stops when all variables not in the model have p-values that are greater than the specified alpha-to-enter value.
  • 후진 제거가 모형에 있는 모든 예측 변수로 시작되고 Minitab은 각 단계에 대한 가장 유의하지 않은 변수를 제거합니다. 모형에 없는 모든 변수가 지정된 제거할 변수에 대한 알파 값보다 작거나 같은 p-값을 갖고 있는 경우 Minitab이 중지됩니다.

단계적 회귀 분석의 문제

  • 2개의 예측 변수가 서로 높은 상관 관계를 갖고 있는 경우 두 변수가 중요하더라도 하나의 변수만 모형에 존재할 수 있습니다.
  • 절차는 많은 모형에 적합하기 때문에 데이터에 적합한 절차가 우연히 선택될 수 있습니다.
  • 단계적 회귀 분석이 지정한 예측 변수 수에 대해 가능한 가장 높은 R2 값을 가진 모형으로 항상 끝나지 않을 수도 있습니다.
  • 자동 절차에서는 분석가가 해당 데이터에 대해 가질 수 있는 특별한 정보를 고려할 수 없습니다. 따라서 선택된 모형이 실제적인 관점에서는 최상이 아닐 수도 있습니다.
이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오