Minitab 통계 소프트웨어는 최적성 기준의 최적 값을 사용하여 모형에 대한 결과를 생성합니다. 기준은 선택에 따라 최소 제곱 오차 또는 최소 절대 편차입니다. Minitab을 사용하면 최적 모형을 식별하는 시퀀스에서 다른 모형들을 탐색할 수 있습니다. 일반적으로 다음 두 가지 이유 중 하나로 대체 모델을 선택합니다.
- 분석에서 선택하는 모형은 기준이 개선되는 패턴의 일부입니다. 일반적으로 가능한 한 예측 정확도를 가진 모델에서 예측을 수행하려고 합니다.
- 분석에서 선택하는 모형은 기준이 비교적 평평한 패턴의 일부입니다. 유사한 모형 요약 통계량을 가진 하나 이상의 모형은 최적 모형보다 훨씬 적은 기저 함수를 갖습니다. 일반적으로 기저 함수가 더 적은 모형은 각 예측 변수가 반응 값에 미치는 영향을 더 명확하게 보여줍니다. 더 작은 모형에 대한 예측 정확도의 차이가 무시할 수 있는 경우 더 작은 모형을 사용하여 반응과 예측 변수 간의 관계를 평가할 수 있습니다.
예를 들어, 다음 그림은 20개의 기저 함수가 있는 트리에 대한 결과와 함께 제공됩니다. 시퀀스의 다른 모델은 유사한R
2 값을 갖는다.

10개의 기저 함수를 갖는 모델의R
2 값은 20개의 기저 함수를 갖는 모델만큼 높습니다. 일반적으로 기저 함수가 더 적은 모형은 각 예측 변수가 반응 값에 미치는 영향을 더 명확하게 보여줍니다. 훨씬 더 작은 모형에서 예측 정확도의 감소가 무시할 수 있는 경우 훨씬 더 작은 모형을 사용하여 반응과 예측 변수 간의 관계를 평가할 수 있습니다.

대체 모델에 대한 기준 값 외에도 모델의 복잡성과 다른 지역의 유용성을 비교할 수도 있습니다. 분석가가 다른 트리와 비교할 때 성능을 희생하지 않는 특정 트리를 선택하는 이유에 대한 다음 예를 생각해 보십시오.
- 분석가는 가장 중요한 변수를 더 명확하게 볼 수 있는 더 작은 모형을 선택합니다.
- 분석에서 모형을 선택하는 이유는 기저 함수가 다른 모형의 변수보다 측정하기 쉬운 변수에 대한 함수이기 때문입니다.
- 분석가가 모형을 선택하는 이유는 예측 변수의 특정 영역에 관심이 있기 때문입니다.