Mallows의 Cp를 사용하면 여러 회귀 모형 중에서 선택하는 데 도움이 됩니다. Mallows의 Cp는 모형 내 예측 변수 개수의 균형을 맞추는 데 유용합니다. Mallows의 Cp는 완전 모형의 정밀도와 치우침을, 예측 변수의 부분 집합을 갖는 모형과 비교합니다.

일반적으로 Mallows의 Cp가 작으면서 모형의 예측 변수 개수에 상수(p)를 더한 값에 가까운 모형을 찾아야 합니다. Mallows의 Cp 값이 작다는 것은 모형이 실제 회귀 계수를 추정하고 미래 반응 값을 예측하는 데 있어서 비교적 정확하다(분산이 작다)는 것을 나타냅니다. Mallows의 Cp 값이 예측 변수 개수에 상수를 더한 값에 가까우면 모형이 회귀 분석 계수를 추정하고 미래의 반응을 예측하는 데 있어 비교적 치우침이 없음을 나타냅니다. 적합성이 결여되고 치우침이 큰 모형의 Mallows의 Cp 값은 p보다 큽니다.

중요

Mallows의 Cp를 이용한 회귀 분석 모형의 비교는 동일한 예측 변수의 전체 집합을 사용하여 시작할 경우에만 유효합니다.

참고

한 예측 변수가 서로 높은 상관 관계에 있는 경우 Mallows의 Cp는 결과에 표시되지 않습니다.

Mallows의 Cp을 사용한 모형 평가의 예

예를 들어, 한 감자 칩 회사에서 용기당 부스러진 감자 칩의 백분율에 영향을 미치는 요인을 살펴보려고 합니다. 다른 성분, 냉각 비율 및 조리 온도에 상대적인 감자의 백분율을 예측 변수로 회귀 모형에 포함합니다.

단계 감자 % 냉각 비율 조리 온도 Mallows의 Cp
1 X     7.2
2 X X   2.9
3 X X X 5.5

위의 결과는 "감자"와 "냉각 비율" 등 항이 두 개인 모형 Mallows의 Cp(2.9)가 예측 변수 개수에 상수를 더한 값(3)에 가장 가깝기 때문에 상대적으로 정밀하고 치우침이 없는 것으로 나타냅니다. Mallows의 Cp는 R2, 수정된 R2, S 등 결과에 포함되는 다른 통계량과 함께 살펴봐야 합니다.