회귀 분석 또는 분산 분석의 모형 가정 검증

회귀 분석 및 분산 분석은 모형을 적합한 경우 중단되지 않습니다. 잔차 그림과 다른 진단 통계량을 조사하여 모형이 적절한지 그리고 회귀에 대한 가정이 충족되었는지 확인해야 합니다. 모형이 적절하지 않은 경우 데이터가 잘못 표시됩니다. 예:
  • 계수의 표준 오차가 편향되어 있어 t-값과 p-값이 올바르지 않을 수 있습니다.
  • 계수의 부호가 잘못되었을 수 있습니다.
  • 모형이 점 한 두 개의 영향을 받을 수 있습니다.
모형이 적절한지 확인하려면 다음 표를 사용하십시오.
적절한 회귀 모형의 특징 확인 방법 가능한 해결책
함수 형식이 존재하는 모든 곡면성을 정확하게 모형화합니다.

적합성 결여 검정

잔차 대 변수 그림

모형에 고차 항을 추가합니다.

변수를 변환합니다.

비선형 회귀 분석

잔차의 분산이 일정합니다.

잔차 대 적합치 그림

변수를 변환합니다.

가중 최소 제곱을 사용합니다.

잔차가 서로 상관되지 않고 독립적입니다.

Durbin-Watson 통계량

잔차 대 순서 그림

새 예측 변수를 추가합니다.

시계열 분석을 사용합니다.

시차 변수를 추가합니다.

잔차가 정규 분포를 따릅니다.

잔차 히스토그램

잔차 정규 확률도

잔차 대 적합치 그림

정규성 검정

변수를 변환합니다.

특이치를 확인합니다.

비정상 관측치 또는 특이치가 없습니다.

잔차 그림

레버리지

Cook의 거리

DFITS

변수를 변환합니다.

특이한 관측치를 제거합니다.

데이터가 잘못된 조건이 아닙니다.

분산 팽창 인수(VIF)

예측 변수의 상관 행렬

예측 변수를 제거합니다.

부분 최소 제곱법

변수를 변환합니다.

모형이 가정을 충족하지 않는 이유를 확인합니다.

모형이 위의 기준을 만족하지 않으면 다음을 수행해야 합니다.
  1. 데이터가 올바르게 입력되었는지 확인합니다. 특히 비정상적인 것으로 식별되는 관측치가 없는지 확인합니다.
  2. 문제의 원인을 확인합니다. 모형이 해당 문제에 얼마나 민감한지 확인할 수도 있습니다. 예를 들어 특이치가 있으면 해당 관측치를 제외하고 회귀 분석을 실행하여 결과가 어떻게 달라지는지 확인합니다.
  3. 위에 나열된 가능한 해결책 중 하나를 사용해 봅니다.