이항 로지스틱 모형 적합의 모형 요약에 대한 방법 및 공식

원하는 방법 또는 공식을 선택하십시오.

이탈도 R2

모형에서 설명하는 반응의 변동 정도를 나타냅니다. 일반적으로 R2 값이 클수록 모형이 데이터를 더 잘 적합시킵니다. 공식은 다음과 같습니다.

표기법

용어설명
DEError Deviance
DTTotal Deviance

수정 이탈도 R2

수정 이탈도 R2은 모형에 있는 예측 변수의 수를 설명하고, 예측 변수 수가 서로 다른 모형을 비교하는 데 유용합니다. 공식은 다음과 같습니다.

표기법

용어설명
R2이탈도 R2
p회귀 자유도
Φ1, 이항 및 포아송 모형의 경우
DT총 이탈도

수정 이탈도 R2의 계산에서는 음수 값이 나올 수 있지만, Minitab는 이런 경우 0을 표시합니다.

Akaike 정보 기준(AIC)

이 통계량은 서로 다른 모델을 비교하는 데 사용합니다. AIC가 작을수록 모형이 데이터를 더 적합합니다.

로그 우도 함수는 평균에 대해 모수화됩니다. 함수의 일반적인 형식은 다음과 같습니다.

개별 기여의 일반적인 형식은 다음과 같습니다.

개별 기여의 구체적인 형식은 모형에 따라 다릅니다.

모형 li
이항 분포
포아송 분포

표기법

용어설명
p회귀 자유도
Lc현재 모형의 로그 우도
yii 번째 행의 사건 수
mii 번째 행의 시행 횟수
i 번째 행의 추정 평균 반응

AICc(Akaike Corrected Information Criterion)

인 경우 AICc가 계산되지 않습니다.

표기법

용어설명
pthe number of coefficients in the model, including the constant
n결측 데이터가 없는 데이터의 행 수

BIC(Bayesian Information Criterion)

표기법

용어설명
p상수를 제외한 모형 내 계수의 수
n결측 데이터가 없는 데이터의 행 수

검정 이탈도 R2 결정계수

검정 이탈도 R2 결정계수는 모형이 설명하는 검정 데이터 세트의 반응에 대한 변동 정도를 나타냅니다. 값이 높을수록 모형이 검정 데이터를 더 잘 적합시킵니다.

수식

다음 방정식은 검정 이탈도 R2 결정계수에 대한 수식을 제공합니다.

다음 방정식이 오차 이탈도를 나타내는 위치:

총 이탈도에 대한 수식, DT(검정)은 모형 형태에 따라 달라집니다.
이항 로지스틱
절편 항이 있는 모형의 경우, 에는 다음과 같은 정의가 있습니다.
절편 항이 없는 모형의 경우 연결 함수의 역함수를 0에서 사용합니다. Minitab의 연결 함수 값은 다음과 같습니다.
로짓 연결 함수
= 0.5.
노밋 연결 함수
= 0.5.
곰핏 연결 함수
.
포아송
절편 항이 있는 모형의 경우
절편 항이 없는 모형의 경우, .

표기법

용어설명
N(Test)검정 데이터 세트의 행 수
제곱 이탈도 잔차
yi검정 데이터 세트에서 i번째 행에 대한 사건 개수
mi검정 데이터 세트에서 i번째 행의 시행 횟수
DE(검정)검정 데이터 세트에 대한 오차 이탈도
DT(검정)검정 데이터 세트에 대한 총 이탈도

K-접기 이탈도 R2

K-접기 이탈도 R2은 K-접기 데이터 세트의 반응에 대한 변동 정도를 나타냅니다. 값이 높을수록 모형이 검정 데이터를 더 잘 적합시킵니다.

설명

DT는 총 이탈도입니다.

표기법

용어설명
K폴드 수
nj접기 j의 표본 크기
접기 ji번째 행에 대한 교차 검증 이탈도 잔차

ROC 곡선 아래 면적

수식

곡선 아래 면적은 사다리꼴 영역의 합계입니다.

여기서 k는 고유한 사건 확률의 수이고 (x0, y0)은 점(0, 0)입니다.

검정 데이터 세트 또는 교차 검증된 데이터에서 곡선에 대한 면적을 계산하려면 해당 곡선의 점을 사용합니다.

예를 들어 ROC 곡선에 다음과 같은 좌표가 있는 4개의 고유한 사건 확률이 있다고 가정합니다.
x(가양성률) y(진양성률)
0.0923 0.3051
0.4154 0.7288
0.7538 0.9322
1 1
그런 다음 ROC 곡선 아래 면적은 다음 계산에 의해 지정됩니다.

표기법

용어설명
TRP진양성률
FPR가양성률
TP진양성, 올바르게 평가된 사건
P실제 긍정적인 사건의 수
FP진음성, 올바르게 평가된 비사건
N실제 부정적인 사건 수
FNR가음성률
TNR진음성률