비선형 회귀 분석에 대한 주요 결과 해석

비선형 회귀 분석 모형을 해석하려면 다음 단계를 수행하십시오. 주요 결과는 적합선 그림, 회귀 분석에 대한 표준 오차 및 잔차 그림 등입니다.

1단계: 회귀선이 데이터에 적합한지 여부 확인

비선형 모형에 하나의 예측 변수가 포함되어 있는 경우 Minitab에서는 적합선 그림을 표시하여 예측 변수와 반응 사이의 관계를 보여줍니다. 이 그림에는 회귀 방정식을 나타내는 회귀선이 포함됩니다. 또한 그림에 95% 신뢰 구간과 예측 구간을 표시할 수도 있습니다.

모형이 데이터를 얼마나 잘 적합하는지, 모형이 목표를 충족하는지 여부를 평가하십시오. 다음과 같은 기준이 충족되는지 여부를 확인하려면 적합선 그림을 조사하십시오.
  • 표본에는 모든 예측 변수의 전체 범위에서 적절한 수의 관측치가 포함됩니다.
  • 모형이 데이터의 곡면성을 적절하게 적합합니다. 데이터에 반복실험이 포함되어 있는 경우 어느 모형이 가장 적합한지 확인하려면 그림, 회귀 분석의 표준 오차(S), 적합성 결여 검정을 조사하십시오.
  • 결과에 중대한 영향을 미칠 수 있는 특이치를 찾아보십시오. 특이치의 원인을 식별해 보십시오. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오(특수 원인). 그런 다음 분석을 반복하십시오. 특이치 탐지에 대한 자세한 내용은 비정상적 관측치에서 확인하십시오.
이 적합선 그림에서 회귀선은 점들의 곡면성을 매우 가깝게 따릅니다. 적합선에서 전체적으로 벗어난 것으로 보이지 않습니다. 점들이 예측 변수 값의 전체 범위를 적절하게 포함합니다.

2단계: 예측 변수와 반응값의 관계 조사

모형의 반응과 항 사이에 존재하는 관계를 설명하려면 회귀 방정식을 사용합니다. 회귀 방정식은 회귀선의 대수적 표현입니다. 평균 반응 값을 계산하려면 각 예측 변수의 값을 방정식에 입력하십시오. 선형 회귀 분석과 달리 비선형 회귀 방정식 형식에는 여러 가지가 있습니다.

비선형 회귀 분석의 경우 선형 회귀 분석에 비해 각 예측 변수가 반응에 미치는 효과를 직관적으로 파악하기 어려울 수 있습니다. 선형 모형의 모수 추정치와 달리 비선형 모형의 모수 추정치에 대해서는 일관된 해석이 없습니다. 각 모수에 대한 올바른 해석은 기대 함수 및 기대 함수 내 모수의 위치에 따라 달라집니다. 비선형 모형에 하나의 예측 변수만 포함되어 있는 경우 예측 변수와 반응 사이의 관계를 확인하려면 적합선 그림을 평가하십시오.

모수 추정치가 통계적으로 유의한지 여부를 확인하려면 모수에 대한 신뢰 구간을 사용하십시오. 귀무 가설 값이 범위에서 제외되면 모수가 통계적으로 유의합니다. Minitab은 비선형 회귀 분석에서 모수에 대한 p-값을 계산할 수 없습니다. 선형 회귀 분석의 경우 각 모수에 대한 귀무 가설 값은 0이며, p-값은 이 값을 기준으로 하지만 아무런 효과가 없습니다. 그러나 비선형 회귀 분석에서 각 모수의 올바른 귀무 가설 값은 기대 함수 및 기대 함수 내 모수의 위치에 따라 달라집니다.

일부 데이터 집합에는 기대 함수, 신뢰 수준, 하나의 신뢰 한계 또는 두 신뢰 한계가 모두 존재하지 않을 수 있습니다. Minitab은 결측 결과를 별표로 나타냅니다. 신뢰 구간에 한쪽 한계가 없을 경우 신뢰 수준을 낮추면 양측 구간이 생길 수 있습니다.

해의 수렴이 반드시 모형 적합치가 최적이이나 오차 제곱합(SSE)이 최소라는 것을 보장하지는 않습니다. 로컬 SSE 최소값 또는 올바르지 않은 기대 함수로 인해 잘못된 모수 값에 대한 수렴이 발생할 수 있습니다. 따라서 모형 적합과 모수 값이 합리적인지 확인하려면 모수 값, 적합선 그림 및 잔차 그림을 조사하는 것이 중요합니다.

방정식

팽창 = (1.07764 - 0.122693 * Kelvin + 0.00408638 * Kelvin ** 2 - 1.42627E-06 * Kelvin ** 3) /
     (1 - 0.00576099 * Kelvin + 0.000240537 * Kelvin ** 2 - 1.23144E-07 * Kelvin ** 3)
주요 결과: 방정식

이 결과에는 하나의 예측 변수와 7개의 모수 추정치가 있습니다. 반응 변수는 '팽창'이며 예측 변수는 켈빈 온도입니다. 긴 방정식이 반응 변수와 예측 변수 사이의 관계를 설명합니다. 켈빈 온도가 1도 증가할 때 구리 팽창에 미치는 영향은 시작 온도에 따라 크게 달라집니다. 온도 변경이 구리 팽창에 미치는 영향은 쉽게 요약할 수 없습니다. 예측 변수와 반응 사이의 관계를 확인하려면 적합선 그림을 평가하십시오.

켈빈 온도 값을 방정식에 입력하는 경우 구리 팽창에 대한 적합치가 산출됩니다.

3단계: 모형이 데이터를 얼마나 잘 적합시키는지 확인

모형이 데이터에 얼마나 적합한지 확인하려면 모형 요약 표와 적합성 결여 표의 통계량을 조사하십시오.

S

S는 모형이 반응을 얼마나 잘 설명하는지 평가하기 위해 사용합니다.

S는 반응 변수 단위로 측정되며, 데이터 값이 적합치로부터 얼마나 떨어져 있는지 나타냅니다. S의 값이 낮을수록 모형이 반응을 더 잘 설명합니다. 그러나 낮은 S 값 자체는 모형이 모형 가정을 충족한다는 것을 나타내지 않습니다. 가정을 확인하려면 잔차 그림을 확인해야 합니다.

적합성 결여

Minitab에서는 데이터에 반복실험이 포함되어 있을 경우 적합성 결여 표를 자동으로 표시합니다. 반복실험이란 예측 변수 값이 동일한 여러 관측치입니다. 데이터에 반복실험이 포함되지 않은 경우에는 이 검정을 수행하기 위해 필요한 순수 오차를 계산할 수 없습니다. 랜덤 변동만 관측된 반응 값 사이의 차이를 유발할 수 있기 때문에 반복실험에 대한 서로 다른 반응 값은 순수 오차를 나타냅니다.

모형이 반응 변수와 예측 변수 간의 관계를 올바르게 지정하는지 여부를 확인하려면 적합성 결여 검정에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 적합성 결여 검정에 대한 귀무 가설은 반응 변수와 예측 변수 간의 관계를 올바르게 지정한다는 것입니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 모형이 반응 변수와 예측 변수 간의 관계를 올바르게 지정하는데 올바르게 지정하지 않는다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 적합성 결여가 통계적으로 유의합니다.
p-값이 유의 수준보다 작거나 같으면 모형이 관계를 올바르게 지정하지 않는다는 결론을 내립니다. 모형을 개선하려면 항을 추가하거나 데이터를 변환해야 할 수도 있습니다.
p-값 > α: 적합성 결여가 통계적으로 유의하지 않습니다.

p-값이 유의 수준보다 크면 검정에서 적합성 결여를 탐지하지 않습니다.

적합성 결여

출처DFSSMSFP
오차2291.532440.0066919   
  적합성 결여2281.525830.00669221.010.679
  순수 오차10.006610.0066125   

요약

반복15
최종 SSE1.53244
DFE229
MSE0.0066919
S0.0818039
* 경고 * 일부 모수 추정치 사이에 깊은 상관 관계가 있습니다. 기대 함수를 단순화하거나 예측 변수나 모수를 변환하여 공선성을 줄여 보십시오.
주요 결과: S, 적합성 결여

이 결과에서 S는 데이터 값과 적합치 간 거리의 표준 편차가 약 0.08 단위임을 나타냅니다. 적합성 결여 검정에 대한 p-값은 0.679로, 모형이 데이터에 적합하지 않는다는 증거가 없습니다.

4단계: 모형이 분석의 가정을 충족하는지 여부 확인

모형이 적절하고 분석의 가정을 충족하는지 여부를 확인하려면 잔차 그림을 사용합니다. 가정이 충족되지 않으면 모형이 데이터에 적합하지 않은 것이므로 결과를 해석할 때 주의해야 합니다.

잔차 그림의 패턴을 처리하는 방법에 대한 자세한 내용을 보려면 비선형 회귀 분석에 대한 잔차 그림으로 이동하여 페이지 상단의 리스트에서 잔차 그림의 이름을 클릭하십시오.

잔차 대 적합치 그림

잔차가 랜덤하게 분포되어 있고 잔차의 분산이 일정하다는 가정을 확인하려면 잔차 대 적합치 그림을 사용하십시오. 이상적으로는 점들이 식별 가능한 패턴 없이 0의 양쪽에 랜덤하게 분포해야 합니다.

다음 표의 패턴들은 모형이 모형 가설을 충족하지 않음을 나타낼 수 있습니다.
패턴 패턴이 나타내는 내용
적합치에 대해 잔차가 부채꼴 모양으로 흩어져 있거나 고르지 않게 퍼져 있음 일정하지 않은 분산
곡선 고차 항 누락
한 점이 0에서 멀리 떨어져 있음 특이치
다른 점에서 x 방향으로 멀리 떨어져 있는 점 영향력 있는 점
이 잔차 대 적합치 그림에서는 데이터가 0 주위에 랜덤하게 분포하는 것으로 보입니다. 잔차의 값이 적합치에 따라 달라진다는 증거가 없습니다.

잔차 대 순서 그림

잔차가 서로 독립적이라는 가정을 확인하려면 잔차 대 순서 그림을 사용하십시오. 독립 잔차는 시간순으로 표시될 때 아무런 추세나 패턴을 보이지 않습니다. 점들의 패턴은 서로 가까이 있는 잔차가 상관되어 있으며, 따라서 독립적이 아닐 수도 있음을 나타냅니다. 이상적으로는 그림의 잔차들이 중심선 주위에 랜덤하게 분포해야 합니다.
패턴이 있으면 원인을 조사하십시오. 다음 유형의 패턴은 잔차가 종속적이라는 것을 나타낼 수도 있습니다.
추세
이동
주기
이 잔차 대 순서 그림에서는 잔차가 중심선 주위에 랜덤하게 위치한 것으로 보입니다. 잔차가 독립적이지 않다는 증거가 없습니다.

잔차의 정규 확률도

잔차가 정규 분포를 따른다는 가정을 확인하려면 잔차의 정규 확률도를 사용하십시오. 잔차의 정규 확률도는 대략 직선을 따라야 합니다.

다음 표의 패턴들은 모형이 모형 가설을 충족하지 않음을 나타낼 수 있습니다.
패턴 패턴이 나타내는 내용
직선이 아님 비정규성
선에서 멀리 떨어져 있는 점 특이치
기울기 변화 식별되지 않은 변수
이 정규 확률도에서는 점들이 일반적으로 거의 직선을 이룹니다. 비정규성, 특이치 또는 식별되지 않은 변수가 있다는 증거가 없습니다.