사전 확률 및 오분류 비용 지정 CART® 분류

통계분석 > 예측 분석 > CART® 분류 > 사전/비용

반응 수준에 대한 사전 확률

사전 확률은 데이터를 수집하기 전에 관측치가 그룹에 속할 확률입니다. 사전 확률을 지정하지 않으면 Minitab은 그룹이 동일하게 발생할 가능성이 있다고 가정합니다.
  • 모든 수준이 동일 확률을 가지고 있음: 기본값은 모든 반응 수준에 대해 동일한 사전 확률을 사용합니다. 예를 들어 반응에 4개의 수준이 있는 경우 각 수준은 0.25로 설정됩니다.
  • 확률이 전체 표본 빈도와 일치: 표본 비율에 따라 사전 확률을 설정합니다. 예를 들어 총 관측치 수가 1000이고 250이 수준 1, 475가 수준 2, 100이 수준 3, 175가 수준 4인 경우 Minitab은 수준에 대해 0.25, 0.475, 0.10 및 0.175의 비율을 사용합니다.
  • 각 수준에 대한 사전 확률 지정: 각 수준에 대한 사전 확률을 설정합니다. 각 값은 0에서 1 사이여야 합니다. 모든 수준의 확률은 1로 합산되어야 합니다.

오분류 비용

오분류 비용을 지정합니다. 기본적으로 Minitab은 1의 동일한 비용을 사용합니다. 더 높은 비용을 나타내려면 더 큰 값을 사용합니다. 비용은 0보다 커야 합니다.

예를 들어 다음 표는 잠재 고객을 잘못 분류하는 데 드는 비용이 관심 없는 고객을 잘못 분류하는 것보다 10배 더 많은 비용이 든다는 것을 반영합니다. 비용의 비율은 관련되어 있지만 실제 비용은 아닙니다.

예측 수준
실제 수준 예(사건) 아니요
예(사건)   10
아니요 1