이항 적합선 그림의 적합치 및 진단

적합치 및 진단에 대한 정의 및 해석 방법을 확인해 보십시오.

적합치

적합치는 사건 확률 또는 예측 확률이라고도 합니다. 사건 확률은 특정 결과 또는 사건이 발생하는 확률입니다. 사건 확률은 카드 한 벌에서 에이스를 뽑거나 불량 부품을 제조하는 것과 같은 사건의 발생 가능성을 추정합니다. 사건 확률의 범위는 0(불가능)에서 1(확실)까지입니다.

해석

이항 로지스틱 분석에서 반응 변수는 특정 질병의 유/무와 같이 두 가지 값 중 하나를 가질 수 있습니다. 사건 확률은 지정된 요인 또는 공변량 패턴에 대한 반응이 1일 가능성입니다(예를 들어, 50대 이상의 여성이 2종 당뇨병에 걸릴 가능성).

실험에서 각각의 수행을 시행이라고 합니다. 예를 들어, 동전을 10번 던져서 앞면이 나오는 횟수를 기록하는 경우 실험을 10번 시행하는 것입니다. 시행이 독립적이고 거의 동일하다면 사건 수를 총 시행 수로 나누어 사건 확률을 추정할 수 있습니다. 예를 들어, 동전을 10번 던져서 앞면이 6번 나온 경우 사건의 추정 확률은 다음과 같습니다.

사건 수 ÷ 시행 수 = 6 ÷ 10 = 0.6

순서 및 명목형 로지스틱 회귀 분석에서 반응 변수는 세 개 이상의 범주를 가질 수 있습니다. 사건 확률은 지정된 요인 또는 공변량 패턴이 특정 반응 범주를 가질 가능성입니다. 누적 사건 확률은 지정된 요인 또는 공변량 패턴에 대한 반응이 k 또는 그 이하 범주에 분포할 가능성입니다. 여기서 k는 반응 범주 1…k입니다.

잔차

잔차는 모형이 관측치를 예측하는 정도를 나타냅니다. 모형으로 잘 적합되지 않은 관측치는 큰 잔차를 갖습니다. Minitab에서는 구별되는 각 요인/공변량 패턴에 대한 잔차를 계산합니다.

해석

모형이 적절하고 회귀 분석의 가정을 충족하는지 여부를 확인하려면 잔차를 그림으로 표시하십시오. 잔차를 조사하면 모형이 데이터에 얼마나 잘 적합되는 지에 대한 유용한 정보를 얻을 수 있습니다. 일반적으로 잔차는 분명한 패턴이나 비정상적인 값 없이 랜덤하게 분포해야 합니다. 데이터에 비정상적인 값이 포함된 것으로 확인되는 경우 Minitab에서는 결과에 있는 비정상적 관측치에 대한 적합치 및 진단 표에 이러한 관측치를 표시합니다. 비정상적인 값에 대한 자세한 내용은 비정상적 관측치에서 확인하십시오.

표준화 잔차

표준화 잔차는 잔차(ei)를 해당 표준 편차의 추정치로 나눈 값과 같습니다.

해석

표준화 잔차를 사용하면 특이치를 탐지하는 데 도움이 됩니다. 일반적으로 2보다 크거나 -2보다 작은 표준화 잔차는 큰 것으로 간주됩니다. 비정상적 관측치에 대한 적합치 및 진단 표에는 이러한 관측치가 'R'로 표시됩니다. 분석 결과 비정상적 관측치가 여러 개 있는 경우 모형이 일반적으로 유의한 적합성 결여를 나타냅니다. 즉, 모형이 요인과 반응 변수의 관계를 적절하게 설명하지 못한다는 의미입니다. 자세한 내용은 비정상적 관측치에서 확인하십시오.

표준화 잔차는 원시 잔차가 특이치를 잘 나타내지 않을 수 있기 때문에 유용합니다. 각 원시 잔차의 분산은 연결된 x-값에 따라 다를 수 있습니다. 이렇게 서로 다른 척도로 인해 원시 잔차의 크기를 평가하기가 어렵습니다. 잔차를 표준화하면 서로 다른 분산이 공통 척도로 변환되어 이 문제가 해결됩니다.