이항 로지스틱 모형 적합이항 로지스틱 회귀 분석에 대한 잔차 그림

잔차 그림에 대한 정의 및 해석 방법을 확인해 보십시오.

잔차 히스토그램

편차 잔차의 히스토그램은 모든 관측치에 대한 잔차 분포를 보여줍니다.

편차 잔차를 사용하든지 Pearson 잔차를 사용하든지 여부에 상관없이 그림은 동일하게 해석됩니다. 모형에서 로짓 연결 함수를 사용하는 경우 편차 잔차의 분포가 최소 제곱법 회귀 모형의 잔차 분포에 더 가깝습니다. 각 예측 변수 설정 조합에 대한 시행 횟수가 증가하면 편차 잔차와 Pearson 잔차가 더 유사해집니다.

해석

데이터가 특정 방향으로 치우쳐 있는지 또는 데이터에 특이치가 포함되어 있는지 확인하려면 잔차 히스토그램을 사용하십시오. 다음 표의 패턴들은 모형이 모형 가설을 충족하지 않음을 나타낼 수 있습니다. 모형이 가정을 충족하지 않는 경우 예측에 대한 정규 근사 신뢰 구간이 부정확할 수 있습니다.
패턴 패턴이 나타내는 내용
한 쪽 방향의 긴 꼬리 왜도
다른 막대들과 멀리 떨어져 있는 막대 특이치

히스토그램 모양은 데이터를 그룹으로 나누는 데 사용된 구간 수에 따라 다르므로, 히스토그램을 사용하여 잔차의 정규성을 평가하지 마십시오. 그 대신 정규 확률도를 사용하십시오.

잔차의 정규 확률도

잔차의 정규 확률도는 분포가 정규 분포일 때 잔차 대 잔차의 기대값을 표시합니다.

편차 잔차를 사용하든지 Pearson 잔차를 사용하든지 여부에 상관없이 그림은 동일하게 해석됩니다. 모형에서 로짓 연결 함수를 사용하는 경우 편차 잔차의 분포가 최소 제곱법 회귀 모형의 잔차 분포에 더 가깝습니다. 각 예측 변수 설정 조합에 대한 시행 횟수가 증가하면 편차 잔차와 Pearson 잔차가 더 유사해집니다.

해석

잔차가 정규 분포를 따른다는 가정을 확인하려면 잔차의 정규 확률도를 사용하십시오. 잔차의 정규 확률도는 대략 직선을 따라야 합니다.

다음 패턴은 잔차가 정규 분포를 따른다는 가정에 위배되는 경우입니다.

S-곡선은 긴 꼬리를 갖는 분포를 의미합니다.

역 S-곡선은 짧은 꼬리를 갖는 분포를 의미합니다.

하향 곡선은 오른쪽으로 치우친 분포를 의미합니다.

선으로부터 멀리 떨어져 있는 몇 개의 점은 특이치를 갖는 분포를 암시합니다.

비정규 패턴이 있으면 다른 잔차 그림을 사용하여 모형에 항 누락 또는 시간 순서 효과와 같은 다른 문제가 있는지 확인하십시오. 잔차가 정규 분포를 따르지 않을 경우 정규 근사 신뢰 구간과 Wald 검정 p-값이 정확하지 않을 수 있습니다.

잔차 대 적합치

잔차 대 적합치 그래프는 y-축에 잔차, x-축에 적합치의 로짓을 표시합니다.
참고

이항 로지스틱 회귀 분석에서는 데이터가 이항 반응/빈도 형식(행당 단일 시행)인 경우 Minitab에서 이 그림을 제공하지 않습니다

편차 잔차를 사용하든지 Pearson 잔차를 사용하든지 여부에 상관없이 그림은 동일하게 해석됩니다. 모형에서 로짓 연결 함수를 사용하는 경우 편차 잔차의 분포가 최소 제곱법 회귀 모형의 잔차 분포에 더 가깝습니다. 각 예측 변수 설정 조합에 대한 시행 횟수가 증가하면 편차 잔차와 Pearson 잔차가 더 유사해집니다.

해석

잔차가 랜덤하게 분포되어 있다는 가정을 확인하려면 잔차 대 적합치 그림을 사용하십시오. 이상적으로는 점들이 식별 가능한 패턴 없이 0의 양쪽에 랜덤하게 분포해야 합니다.

다음 표의 패턴들은 모형이 모형 가설을 충족하지 않음을 나타낼 수 있습니다.
패턴 패턴이 나타내는 내용
적합치에 대해 잔차가 부채꼴 모양으로 흩어져 있거나 고르지 않게 퍼져 있음 부적절한 연결 함수
곡선 고차 항 누락 또는 부적절한 연결 함수
한 점이 0에서 멀리 떨어져 있음 특이치
다른 점에서 x 방향으로 멀리 떨어져 있는 점 영향력 있는 점
다음 그래프는 특이치 및 잔차의 분산이 일정하다는 가정의 위반을 보여줍니다.
특이치가 있는 그래프

점 중 하나가 나머지 모든 점보다 훨씬 더 큽니다. 따라서 그 점이 특이치입니다. 특이치가 너무 많으면 모형이 적절하지 않을 수 있습니다. 특이치의 원인을 식별해야 합니다. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오(특수 원인). 그런 다음 분석을 반복하십시오.

일정하지 않은 분산이 있는 그림

잔차의 분산이 적합치에 따라 증가합니다. 적합치가 증가하면 잔차 간의 산포가 더 넓어집니다. 이 패턴은 잔차의 분산이 동일하지(일정하지) 않다는 것을 나타냅니다.

잔차 대 적합치 그림에서 패턴이나 특이치를 찾은 경우 다음 방법을 사용해 보십시오.
문제 가능한 해결 방법
일정하지 않은 분산 모형의 다른 항, 다른 연결 함수 또는 가중치를 사용하는 것을 고려해 보십시오.
특이치 또는 영향력 있는 점
  1. 관측치가 측정 오류 또는 데이터 입력 오류인지 확인하십시오.
  2. 이 관측치 없이 분석을 수행하여 결과에 어떤 영향을 미치는지 살펴보십시오.

잔차 대 순서

잔차 대 순서 그림은 잔차를 데이터가 수집된 순서대로 표시합니다.

편차 잔차를 사용하든지 Pearson 잔차를 사용하든지 여부에 상관없이 그림은 동일하게 해석됩니다. 모형에서 로짓 연결 함수를 사용하는 경우 편차 잔차의 분포가 최소 제곱법 회귀 모형의 잔차 분포에 더 가깝습니다. 각 예측 변수 설정 조합에 대한 시행 횟수가 증가하면 편차 잔차와 Pearson 잔차가 더 유사해집니다.

해석

잔차가 서로 독립적이라는 가정을 확인하려면 잔차 대 순서 그림을 사용하십시오. 독립 잔차는 시간순으로 표시될 때 아무런 추세나 패턴을 보이지 않습니다. 점들의 패턴은 서로 가까이 있는 잔차가 상관되어 있으며, 따라서 독립적이 아닐 수도 있음을 나타냅니다. 이상적으로는 그림의 잔차들이 중심선 주위에 랜덤하게 분포해야 합니다.
패턴이 있으면 원인을 조사하십시오. 다음 유형의 패턴은 잔차가 종속적이라는 것을 나타낼 수도 있습니다.
추세
이동
주기

잔차 대 변수

잔차 대 변수 그림은 잔차 대 다른 변수를 표시합니다. 변수가 이미 모형에 포함되어 있을 수 있습니다. 또는 변수가 모형에 포함되어 있지 않을 수도 있지만 반응에 영향을 미칠 것으로 예상됩니다.

편차 잔차를 사용하든지 Pearson 잔차를 사용하든지 여부에 상관없이 그림은 동일하게 해석됩니다. 모형에서 로짓 연결 함수를 사용하는 경우 편차 잔차의 분포가 최소 제곱법 회귀 모형의 잔차 분포에 더 가깝습니다. 각 예측 변수 설정 조합에 대한 시행 횟수가 증가하면 편차 잔차와 Pearson 잔차가 더 유사해집니다.

해석

변수가 이미 모형에 포함되어 있는 경우 이 그림을 사용하여 변수의 고차 항을 추가해야 할지 여부를 결정합니다. 변수가 모형에 포함되지 않은 경우에는 이 그림을 사용하여 변수가 체계적인 방식으로 반응에 영향을 미치는지 여부를 확인합니다.

이 패턴은 중요한 변수 또는 항을 나타낼 수 있습니다.
패턴 패턴이 나타내는 내용
잔차의 패턴 변수가 체계적으로 반응에 영향을 미칩니다. 모형에 변수가 없는 경우에는 해당 변수에 대한 항을 포함하고 모형을 다시 적합시킵니다.
점의 곡면성 변수의 고차 항을 모형에 포함해야 합니다. 예를 들어, 곡선이 있는 패턴은 제곱 항을 추가해야 한다는 것을 의미합니다.