이항 적합선 그림에 대한 주요 결과 해석

이항 적합선 그림을 해석하려면 다음 단계를 수행하십시오. 주요 결과에는 p-값, 적합선 그림, 이탈도 R2 및 잔차 그림이 포함됩니다.

1단계: 반응과 예측 변수 간의 연관성이 통계적으로 유의한지 여부 확인

반응 변수와 예측 변수 간의 연관성이 통계적으로 유의한지 여부를 확인하려면 항에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 예측 변수에 대한 계수가 0으로, 예측 변수와 반응 변수 간에 연관성이 없다는 것을 나타냅니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시됨)이 적절합니다. 0.05의 유의 수준은 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 연관성이 통계적으로 유의함
p-값이 유의 수준보다 작거나 같으면 반응 변수와 예측 변수 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다.
p-값 > α: 연관성이 통계적으로 유의하지 않음
p-값이 유의 수준보다 크면 반응 변수와 예측 변수 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다.

분산 분석

출처DF수정 분산수정 평균카이-제곱P-값
회귀122.705222.705222.710.000
  투여량(mg)122.705222.705222.710.000
오차40.93730.2343   
총계523.6425     
주요 결과: p-값

이 결과에서는 복용량에 대한 p-값이 0.000으로, 유의 수준 0.05보다 작습니다. 이 결과는 치료 종료 시 복용량과 박테리아의 존재 간 연관성이 통계적으로 유의하다는 것을 나타냅니다.

2단계: 예측 변수의 효과 이해

예측 변수의 효과를 이해하려면 승산비를 사용합니다. 모형에서 로짓 연결 함수를 사용하는 경우 Minitab에서는 승산비를 계산합니다.

승산비가 1보다 크면 예측 변수가 증가함에 따라 사건 발생 확률이 증가한다는 것을 나타냅니다. 승산비가 1보다 작으면 예측 변수가 증가함에 따라 사건 발생 확률이 감소한다는 것을 나타냅니다.

계량형 예측 변수에 대한 승산비

변경 단위승산비95% CI
투여량(mg)0.56.1279(1.7218, 21.8087)
주요 결과: 승산비

이 결과에서 모형은 한 약품의 투여량 수준을 사용하여 성인의 박테리아 존재 여부를 예측합니다. 각 약에는 0.5mg의 투여량이 포함되어 있으며, 따라서 연구자들은 0.5mg의 단위 변화를 사용합니다. 승산비는 약 6입니다. 성인이 약 하나를 추가로 복용할 때마다 환자에게 박테리아가 없을 확률은 약 6배 증가합니다.

반응 변수와 예측 변수 간의 관계를 조사하려면 적합선 그림을 사용합니다.

주요 결과: 이항 적합선 그림

이 결과에서는 방정식이 성공 확률로 표시됩니다. y-축의 반응 값 1이 성공을 나타냅니다. 그림은 온도가 증가함에 따라 성공 확률이 감소한다는 것을 보여줍니다. 데이터에서 온도가 50에 가까운 경우 선의 기울기가 아주 크지 않으며, 이는 온도가 증가함에 따라 확률이 감소한다는 것을 나타냅니다. 온도 데이터의 중간 부분에서 선이 가파르며, 이는 1도의 온도 변화가 이 범위에서 더 큰 영향을 미친다는 것을 나타냅니다. 온도 범위의 상단 부분에서 성공 확률이 0에 가까워지면 선이 다시 평평해집니다.

3단계: 모형이 데이터를 얼마나 잘 적합시키는지 확인

모형이 데이터를 얼마나 잘 적합시키는지 확인하려면 모형 요약 표의 통계량을 조사하십시오. 이항 로지스틱 회귀 분석의 경우 데이터 형식이 이탈도 R2 통계량에 영향을 미치지만 AIC에는 영향을 미치지 않습니다. 자세한 내용은 이항 로지스틱 회귀 분석에서 데이터 형식이 적합도에 미치는 영향에서 확인하십시오.

이탈도 R-제곱

이탈도 R2이 클수록 모형이 데이터를 더 잘 적합시킵니다. 이탈도 R2은 항상 0%에서 100% 사이입니다.

모형에 예측 변수를 추가하면 이탈도 R2은 항상 증가합니다. 예를 들어, 최량 예측 변수가 5개인 모형은 최량 예측 변수가 4개인 모형보다 항상 R2 값이 큽니다. 따라서 이탈도 R2은 같은 크기의 모형을 비교할 때 가장 유용합니다.

이항 로지스틱 회귀 분석의 경우, 데이터 형식이 이탈도 R2 값에 영향을 미칩니다. 사건/시행 형식 데이터의 경우 일반적으로 이탈도 R2이 더 높습니다. 이탈도 R2 값은 동일한 데이터 형식을 사용하는 모형 간에만 유사합니다.

이탈도 R2은 모형이 데이터를 얼마나 잘 적합시키는지 나타내는 측도입니다. 모형의 R2이 높더라도 잔차 그림을 확인하여 모형이 데이터를 얼마나 잘 적합시키는지 평가해야 합니다.

이탈도 R-제곱(수정)

예측 변수 수가 다른 여러 모형을 비교하려면 수정 이탈도 R2을 사용하십시오. 모형에 예측 변수를 추가하면 이탈도 R2은 항상 증가합니다. 수정 이탈도 R2 값은 모형의 예측 변수 수에 통합되어 올바른 모형을 선택하는 데 유용합니다.

AIC, AICc 및 BIC
이항 적합선 그림의 경우 여러 연결 함수 또는 여러 예측 변수의 적합도를 비교하기 위해 정보 기준을 사용할 수 있습니다. 작은 값을 사용하는 것이 바람직합니다. 그러나 값이 가장 작은 모형이 데이터를 반드시 잘 적합하는 것은 아닙니다. 또한 검정과 잔차 그림을 사용하여 모형이 데이터를 얼마나 잘 적합시키는지 평가하십시오.

모형 요약

이탈도 R-Sq이탈도 R-Sq(수정)AICAICcBICROC 곡선 아래 면적
96.04%91.81%10.6314.6310.220.9398
주요 결과: 이탈도 R-제곱, 이탈도 R-제곱(수정), AIC

이 결과에서 모형은 반응 변수에 있는 이탈도의 96.04%를 설명합니다. 이러한 데이터의 경우 이탈도 R2 값은 모형이 데이터를 잘 적합시킨다는 것을 나타냅니다. 다른 예측 변수를 사용하여 추가 모형을 적합하는 경우 다른 값을 사용하여 모형이 데이터를 얼마나 잘 적합하는지 비교하십시오.

4단계: 모형이 분석의 가정을 충족하는지 여부 확인

모형이 적절하고 분석의 가정을 충족하는지 여부를 확인하려면 잔차 그림을 사용합니다. 가정이 충족되지 않으면 모형이 데이터에 적합하지 않은 것이므로 결과를 해석할 때 주의해야 합니다.

잔차 그림의 패턴을 처리하는 방법에 대한 자세한 내용을 보려면 이항 적합선 그림에 대한 그래프으로 이동하여 페이지 상단의 리스트에서 잔차 그림의 이름을 클릭하십시오.

잔차 대 적합치 그림

잔차가 랜덤하게 분포되어 있다는 가정을 확인하려면 잔차 대 적합치 그림을 사용하십시오. 이상적으로는 점들이 식별 가능한 패턴 없이 0의 양쪽에 랜덤하게 분포해야 합니다.

잔차 대 적합치 그림은 데이터가 사건/시행 형식인 경우에만 사용할 수 있습니다.

다음 표의 패턴들은 모형이 모형 가설을 충족하지 않음을 나타낼 수 있습니다.
패턴 패턴이 나타내는 내용
적합치에 대해 잔차가 부채꼴 모양으로 흩어져 있거나 고르지 않게 퍼져 있음 부적절한 연결 함수
곡선 고차 항 누락 또는 부적절한 연결 함수
한 점이 0에서 멀리 떨어져 있음 특이치
다른 점에서 x 방향으로 멀리 떨어져 있는 점 영향력 있는 점
이 잔차 대 적합치 그림에서는 데이터가 0 주위에 랜덤하게 분포하는 것으로 보입니다. 잔차의 값이 적합치에 따라 달라진다는 증거가 없습니다.

잔차 대 순서 그림

잔차가 서로 독립적이라는 가정을 확인하려면 잔차 대 순서 그림을 사용하십시오. 독립 잔차는 시간순으로 표시될 때 아무런 추세나 패턴을 보이지 않습니다. 점들의 패턴은 서로 가까이 있는 잔차가 상관되어 있으며, 따라서 독립적이 아닐 수도 있음을 나타냅니다. 이상적으로는 그림의 잔차들이 중심선 주위에 랜덤하게 분포해야 합니다.
패턴이 있으면 원인을 조사하십시오. 다음 유형의 패턴은 잔차가 종속적이라는 것을 나타낼 수도 있습니다.
추세
이동
주기
이 잔차 대 순서 그림에서는 잔차가 중심선 주위에 랜덤하게 위치한 것으로 보입니다. 잔차가 독립적이지 않다는 증거가 없습니다.