이항 로지스틱 모형 적합이항 로지스틱 회귀 분석 대한 ROC(Receiver Operating Characteristic) 곡선

ROC 곡선은 y축에 검정력이라고도 하는 진양성률(TPR)을 플로팅합니다. ROC 곡선은 x축에서 유형 1 오차라고도 하는 가양성률(FPR)을 표시합니다. ROC 곡선 아래의 면적은 이항 모형이 올바른 분류자인지 여부를 나타냅니다.

해석

ROC 곡선 값 아래의 면적은 0.5에서 1사이입니다. 이항 모형이 등급을 완벽하게 구분할 수 있는 경우 곡선 아래 면적은 1입니다. 이항 모형이 임의 할당보다 등급을 더 잘 구분할 수 없는 경우 곡선 아래 면적은 0.5입니다.

별도의 검정 세트를 사용하지 않는 경우 Minitab은 데이터 세트를 사용하여 ROC 곡선을 만듭니다.

이 예에서 검정 곡선 아래의 면적은 0.9405입니다.

Minitab에서는 검증 방법을 사용하여 두 개의 ROC 곡선을 생성합니다. 한 곡선은 훈련 데이터에 대한 것이고 다른 하나는 검증 데이터에 대한 것입니다. 검증 결과는 모형이 새 관측치에 대한 반응 값을 적절하게 예측할 수 있는지 또는 반응과 예측 변수 간의 관계를 적절하게 요약할 수 있는지를 나타냅니다. 학습 결과는 일반적으로 실제보다 더 이상적이며 참조용입니다.

ROC 곡선 아래의 k-폴드 영역이 ROC 곡선 아래의 영역보다 실질적으로 작으면 모형이 과적합되었음을 나타낼 수 있습니다. 과도 적합 모형은 모집단에서 중요하지 않은 항을 포함할 때 발생합니다. 모형은 학습 데이터에 맞게 조정되므로 모집단에 대한 예측을 만드는 데 유용하지 않을 수 있습니다.

이 예제에서는 훈련 곡선이 검정 곡선보다 더 잘 적합된 것을 보여줍니다. 테스트 곡선의 성능은 일반적으로 새 데이터에 대해 모델이 어떻게 수행되는지를 더 잘 나타냅니다. 검정 곡선 아래의 면적은 0.8882입니다.