이항 로지스틱 모형 적합에 대한 수신자 검사 특성(ROC) 곡선

ROC 곡선은 y축에 검정력이라고도 하는 진양성률(TPR)을 플로팅합니다. ROC 곡선은 x축에서 유형 1 오차라고도 하는 가양성률(FPR)을 플로팅합니다. ROC 곡선 아래의 면적은 이항 모형이 올바른 분류자인지 여부를 나타냅니다.

해석

ROC 곡선 값 아래의 면적은 0.5에서 1사이입니다. 이항 모형이 클래스를 완벽하게 구분할 수 있는 경우 곡선 아래의 면적은 1입니다. 이항 모형이 임의 할당보다 클래스를 더 잘 구분할 수 없는 경우 곡선 아래의 면적은 0.5입니다.

별도의 검정 세트를 사용하지 않는 경우 Minitab은 데이터 세트를 사용하여 ROC 곡선을 만듭니다.

이 예에서 검정 곡선 아래의 면적은 0.9405입니다.

검증 방법을 사용하면 Minitab에서 두 개의 ROC 곡선을 만듭니다. 한 곡선은 학습 데이터용이고 다른 곡선은 검증 데이터용입니다. 검증 결과는 모형이 새 관측치에 대한 반응 값을 적절하게 예측할 수 있는지 또는 반응과 예측 변수 간의 관계를 적절하게 요약할 수 있는지를 나타냅니다. 학습 결과는 일반적으로 실제보다 더 이상적이며 참조용입니다.

ROC 곡선 아래의 k-폴드 면적이 ROC 곡선 아래의 영역보다 현저히 적으면 모형이 과도하게 적합하다는 것을 나타낼 수 있습니다. 과도 적합 모형은 모집단에서 중요하지 않은 항을 추가할 때 발생합니다. 모형은 학습 데이터에 맞게 조정되므로 모집단에 대한 예측을 만드는 데 유용하지 않을 수 있습니다.

이 예에서 학습 곡선은 테스트 곡선보다 더 나은 적합도를 보여줍니다. 검정 곡선의 성능은 일반적으로 모형이 새 데이터에 대해 수행하는 방식을 더 잘 표현합니다. 검정 곡선 아래의 면적은 0.8882입니다.