안정성 연구의 잔차 그림

모든 잔차 그림에 대한 정의 및 해석 방법을 확인해 보십시오.

잔차 히스토그램

잔차 히스토그램은 모든 관측치에 대한 잔차 분포를 보여줍니다.

해석

데이터가 특정 방향으로 치우쳐 있는지 또는 데이터에 특이치가 포함되어 있는지 확인하려면 잔차 히스토그램을 사용하십시오. 다음 표의 패턴은 모형이 모형의 가정을 충족하지 않는다는 것을 나타낼 수도 있습니다.
패턴 패턴이 나타내는 내용
한 방향의 긴 꼬리 왜도
다른 막대와 멀리 떨어져 있는 막대 특이치

히스토그램의 모양은 데이터를 그룹화하는 데 사용되는 구간 수에 따라 달라지므로 잔차의 정규성을 평가하기 위해 히스토그램을 사용하지 마십시오. 대신 정규 확률도를 사용하십시오.

히스토그램은 데이터 점의 수가 약 20개 이상일 때 가장 효과적입니다. 표본이 너무 작으면 히스토그램의 각 막대에 왜도 또는 특이치를 확실하게 보여주기 위한 충분한 데이터 점이 포함되지 않습니다.

잔차의 정규 확률도

잔차의 정규 확률도는 분포가 정규 분포일 때 잔차 대 잔차의 기대값을 표시합니다.

참고

배치 요인이 변량 요인이면 조건부 잔차를 사용하여 정규성을 평가하십시오.

해석

잔차가 정규 분포를 따른다는 가정을 확인하려면 잔차의 정규 확률도를 사용하십시오. 잔차의 정규 확률도는 대략 직선을 따라야 합니다.

다음 패턴은 잔차가 정규 분포를 따른다는 가정에 위배되는 경우입니다.

S-곡선은 긴 꼬리를 갖는 분포를 의미합니다.

역 S-곡선은 짧은 꼬리를 갖는 분포를 의미합니다.

하향 곡선은 오른쪽으로 치우친 분포를 의미합니다.

선으로부터 멀리 떨어져 있는 몇 개의 점은 특이치를 갖는 분포를 암시합니다.

비정규 패턴이 있으면 다른 잔차 그림을 사용하여 모형에 일정하지 않은 분산 또는 시간 순서 효과와 같은 다른 문제가 있는지 확인하십시오. 잔차가 정규 분포를 따르지 않고 데이터의 관측치 수가 15개 미만이면 예측, 계수에 대한 신뢰 구간 및 계수에 대한 p-값이 정확하지 않을 수 있습니다.

잔차 대 적합치

다음 그래프는 특이치 및 잔차의 분산이 일정하다는 가정의 위반을 보여줍니다.
특이치가 있는 그래프

점 중 하나가 나머지 모든 점보다 훨씬 더 큽니다. 따라서 그 점이 특이치입니다. 특이치가 너무 많으면 모형이 적절하지 않을 수 있습니다. 특이치의 원인을 식별해야 합니다. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오(특수 원인). 그런 다음 분석을 반복하십시오.

일정하지 않은 분산이 있는 그림

잔차의 분산이 적합치에 따라 증가합니다. 적합치가 증가하면 잔차 간의 산포가 더 넓어집니다. 이 패턴은 잔차의 분산이 동일하지(일정하지) 않다는 것을 나타냅니다.

잔차 대 적합치 그림에서 패턴이나 특이치를 찾은 경우 다음 방법을 사용해 보십시오.

문제 가능한 해결 방법
일정하지 않은 분산 Box-Cox 변환을 사용하는 것을 고려해 보십시오. 자세한 내용은 안정성 연구에 대한 Box-Cox 변환 수행에서 확인하십시오.
특이치 또는 영향력 있는 점
  1. 관측치가 측정 오류 또는 데이터 입력 오류인지 확인하십시오.
  2. 이 관측치 없이 분석을 수행하여 결과에 어떤 영향을 미치는지 살펴보십시오.

잔차 대 순서

잔차 대 순서 그림은 잔차를 데이터가 수집된 순서대로 표시합니다.

해석

잔차가 서로 독립적이라는 가정을 확인하려면 잔차 대 순서 그림을 사용하십시오. 독립 잔차는 시간순으로 표시될 때 아무런 추세나 패턴을 보이지 않습니다. 점들의 패턴은 서로 가까이 있는 잔차가 상관되어 있으며, 따라서 독립적이 아닐 수도 있음을 나타냅니다. 이상적으로는 그림의 잔차들이 중심선 주위에 랜덤하게 분포해야 합니다.
패턴이 있으면 원인을 조사하십시오. 다음 유형의 패턴은 잔차가 종속적이라는 것을 나타낼 수도 있습니다.
추세
이동
주기

잔차 대 변수

잔차 대 변수 그림은 잔차 대 다른 변수를 표시합니다. 변수가 이미 모형에 포함되어 있을 수 있습니다. 또는 변수가 모형에 포함되어 있지 않을 수도 있지만 반응에 영향을 미칠 것으로 예상됩니다.

해석

잔차에 랜덤하지 않은 패턴이 있으면 변수가 체계적으로 반응에 영향을 미친다는 것을 나타냅니다. 이 변수를 분석에 포함하는 것을 고려해 보십시오.