회귀 모형 적합에 대한 분산 분석표

분산 분석표의 모든 통계량에 대한 정의 및 해석을 확인해 보십시오.

DF

전체 자유도(DF)는 데이터에 있는 정보의 양입니다. 분석에서는 이 정보를 사용하여 알려져 있지 않은 모집단 모수의 값을 추정합니다. 전체 DF는 표본의 관측치 수로 결정됩니다. 항의 DF는 해당 항에서 사용하는 정보의 양을 보여줍니다. 표본 크기를 증가시키면 모집단에 대한 더 많은 정보가 제공되므로, 전체 DF가 증가합니다. 모형의 항 수를 증가시키면 더 많은 정보를 사용하며, 모수 추정치의 변동성을 추정하기 위해 사용할 수 있는 DF가 감소합니다.

두 조건이 충족되면 Minitab에서 오차에 대한 DF를 분할합니다. 첫 번째 조건은 현재 모형에 포함되지 않은 데이터를 사용하여 적합할 수 있는 항이 있어야 한다는 것입니다. 예를 들어, 구별되는 값이 3개 이상인 계량형 예측 변수가 있는 경우 해당 예측 변수에 대한 2차 항을 추정할 수 있습니다. 모형에 2차 항이 포함되지 않은 경우 데이터가 적합할 수 있는 항이 모형에 포함되지 않으며 이 조건이 충족됩니다.

두 번째 조건은 데이터에 반복실험이 포함된다는 것입니다. 반복실험은 각 예측 변수의 값이 같은 관측치입니다. 예를 들어, 압력이 5이고 온도가 25인 관측치가 3개인 경우 이 3개의 관측치가 반복실험입니다.

두 조건이 충족되면 오차에 대한 DF의 두 부분이 적합성 결여 및 순수 오차입니다. 적합성 결여에 대한 DF를 사용하면 모형 형태가 적절한지 여부를 검정할 수 있습니다. 적합성 결여 검정은 적합성 결여에 대한 자유도를 사용합니다. 순수 오차에 대한 DF가 클수록 적합성 결여 검정의 검정력이 더 큽니다.

Adj SS

수정 제곱합은 모형의 여러 성분에 대한 변동성의 측도입니다. 모형 내 예측 변수의 순서는 수정 제곱합의 계산에 영향을 미치치 않습니다. 분산 분석표에서 Minitab은 제곱합을 여러 요인으로 인한 변동을 설명하는 여러 성분으로 나눕니다.

Adj SS 항
항에 대한 수정 제곱합은 다른 항만 있는 모형에 비해 회귀 제곱합에서 증가합니다. 이 값은 모형의 각 항으로 설명하는 반응 데이터의 변동량을 나타냅니다.
Adj SS 오차
오차 제곱합은 잔차 제곱의 합입니다. 이 값은 예측 변수가 설명하지 않는 데이터의 변동량을 나타냅니다.
Adj SS 총합
총 제곱합은 항 제곱합과 오차 제곱합의 합입니다. 이 값은 데이터의 총 변동량을 나타냅니다.

해석

Minitab에서는 항에 대한 p-값을 계산하기 위해 수정 제곱합을 사용합니다. Minitab에서는 또한 R2 통계량을 계산하기 위해 제곱합을 사용합니다. 일반적으로 제곱합 대신 p-값과 R2 통계량을 해석합니다.

Adj MS

수정 평균 제곱은 다른 모든 항이 모형에 있다는 가정 하에 항이 입력된 순서와 관계없이 항 또는 모형이 설명하는 변동의 정도를 측정합니다. 수정 제곱합과 달리 수정 평균 제곱에서는 자유도를 고려합니다.

오차의 수정 평균 제곱(MSE 또는 s2이라고도 함)은 적합치 주변의 분산입니다.

해석

Minitab에서는 항에 대한 p-값을 계산하기 위해 수정 평균 제곱을 사용합니다. Minitab에서는 또한 수정 R2 통계량을 계산하기 위해 수정 평균 제곱을 사용합니다. 일반적으로 수정 평균 제곱 대신 p-값과 수정 R2 통계량을 해석합니다.

Seq SS

순차 제곱합은 모형의 여러 성분에 대한 변동성의 측도입니다. 수정 제곱합과 달리 순차 제곱합은 모형에 항을 입력한 순서에 따라 다릅니다. 분산 분석표에서 Minitab은 순차 제곱합을 여러 요인으로 인한 변동을 설명하는 여러 성분으로 나눕니다.

Seq SS 회귀 분석
회귀 제곱합은 적합 반응 값과 평균 반응 값 차이의 제곱합입니다. 이 값은 모형이 설명하는 반응 변수 데이터의 변동량을 수량화합니다.
Seq SS 항
항에 대한 순차 제곱합은 이전에 입력한 항이 설명하지 않는 항으로 설명하는 변동의 고유한 부분입니다. 이 값은 각 항이 순차적으로 모형에 추가됨에 따라 각 항이 설명하는 반응 데이터의 변동량을 나타냅니다.
Seq SS 오차
오차 제곱합은 잔차 제곱의 합입니다. 이 값은 예측 변수가 설명하지 않는 데이터의 변동량을 나타냅니다.
Seq 총 제곱합
총 제곱합은 순차항 제곱합과 오차 제곱합의 합이며, 데이터의 총 변동을 수량화합니다.

해석

Minitab에서는 항에 대한 p-값을 계산하기 위해 순차 제곱합을 사용합니다. Minitab에서는 또한 R2 통계량을 계산하기 위해 제곱합을 사용합니다. 일반적으로 제곱합 대신 p-값과 R2 통계량을 해석합니다.

Seq MS

순차 평균 제곱은 항 또는 모형이 설명하는 변동량을 측정합니다. 순차 평균 제곱은 모형에 항을 입력한 순서에 따라 다릅니다. 순차 제곱합과 달리 순차 평균 제곱에서는 자유도를 고려합니다.

순차 평균 제곱 오차(MSE 또는 s2이라고도 함)는 적합치 주변의 분산입니다.

해석

Minitab에서는 항에 대한 p-값을 계산하기 위해 순차 평균 제곱을 사용합니다. Minitab에서는 또한 수정 R2 통계량을 계산하기 위해 순차 평균 제곱을 사용합니다. 일반적으로 순차 평균 제곱 대신 p-값과 수정 R2 통계량을 해석합니다.

기여

기여는 분산 분석표의 각 원인이 총 순차 제곱합(Seq SS)에 기여하는 백분율을 표시합니다.

해석

백분율이 높을수록 원인이 반응의 더 많은 변동을 설명한다는 것을 나타냅니다.

F-값

분산 분석표에 각 항에 대한 F-값이 표시됩니다.
모형 또는 항에 대한 F-값
F-값은 항이 반응과 연관되어 있는지 여부를 확인하기 위해 사용되는 검정 통계량입니다.
적합성 결여 검정에 대한 F-값
F-값은 모형에 현재 모형의 예측 변수가 포함된 고차항이 누락되어 있는지 여부를 확인하기 위해 사용되는 검정 통계량입니다.

해석

Minitab에서는 F-값을 사용하여 항과 모형의 통계적 유의성에 대한 결정을 내릴 때 사용하는 p-값을 계산합니다. p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

F-값이 충분히 크면 항이나 모형이 유의하다는 것을 나타냅니다.

F-값을 사용하여 귀무 가설의 기각 여부를 확인하려면 F-값을 임계값과 비교하십시오. Minitab에서 임계값을 계산하거나 대부분의 통계 서적에 있는 F-분포 표에서 임계값을 찾을 수 있습니다. Minitab을 사용하여 임계값을 계산하는 데 대한 자세한 내용을 보려면 역 누적분포함수(ICDF) 사용에서 "ICDF를 사용하여 임계값 계산"을 클릭하십시오.

P-값 - 회귀 분석

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

해석

모형이 반응의 변동을 설명하는지 여부를 확인하려면 모형에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 전체 회귀 분석에 대한 귀무 가설은 모형이 반응의 변동을 설명하지 못한다는 것입니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 모형이 반응의 변동을 설명하지 않는데 설명한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 모형이 반응의 변동을 설명합니다.
p-값이 유의 수준보다 작거나 같으면 모형이 반응의 변동을 설명한다는 결론을 내립니다.
p-값 > α: 모형이 반응의 변동을 설명하다는 결론을 내릴 수 있는 충분한 증거가 없습니다.

p-값이 유의 수준보다 크면 모형이 반응의 변동을 설명한다는 결론을 내릴 수 없습니다. 새 모형을 적합할 수도 있습니다.

p-값 – 항

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

해석

반응과 모형의 각 항 간의 연관성이 통계적으로 유의한지 여부를 확인하려면 항에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 항과 반응 간에 연관성이 없다는 것입니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 연관성이 통계적으로 유의합니다.
p-값이 유의 수준보다 작거나 같으면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다.
p-값 > α: 연관성이 통계적으로 유의하지 않습니다.
p-값이 유의 수준보다 크면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다. 항 없이 모형을 다시 적합시킬 수도 있습니다.
반응과 통계적으로 유의한 연관성이 없는 예측 변수가 여러 개 있는 경우 한 번에 하나씩 항을 줄여 모형을 축소할 수 있습니다. 모형에서 항을 제거하는 방법은 모형 축소에서 확인하십시오.
모형 항이 통계적으로 유의하면 해석은 항의 유형에 따라 다릅니다. 해석은 다음과 같습니다.
  • 계량형 예측 변수가 유의하면 예측 변수에 대한 계수가 0이 아니라는 결론을 내릴 수 있습니다.
  • 범주형 예측 변수가 유의하면 일부 수준 평균이 같지 않다는 결론을 내릴 수 있습니다.
  • 교호작용 항이 유의하면 예측 변수와 반응 간의 관계가 항의 다른 예측 변수에 따라 다르다는 결론을 내릴 수 있습니다.
  • 다항식 항이 유의하면 데이터에 곡면성이 포함되어 있다는 결론을 내릴 수 있습니다.

p-값 - 적합성 결여

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다. Minitab은 데이터에 반복실험(x 값이 같은 여러 개의 관측치)이 포함되어 있을 경우 순수 오차 적합성 결여 검정을 자동으로 수행합니다. 랜덤 변동만이 관측된 반응 값 사이의 차이를 유발할 수 있기 때문에 반복실험은 "순수 오차"를 나타냅니다.

해석

모형이 반응 변수와 예측 변수 간의 관계를 올바르게 지정하는지 여부를 확인하려면 적합성 결여 검정에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 적합성 결여 검정에 대한 귀무 가설은 반응 변수와 예측 변수 간의 관계를 올바르게 지정한다는 것입니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 모형이 반응 변수와 예측 변수 간의 관계를 올바르게 지정하는데 올바르게 지정하지 않는다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 적합성 결여가 통계적으로 유의합니다.
p-값이 유의 수준보다 작거나 같으면 모형이 관계를 올바르게 지정하지 않는다는 결론을 내립니다. 모형을 개선하려면 항을 추가하거나 데이터를 변환해야 할 수도 있습니다.
p-값 > α: 적합성 결여가 통계적으로 유의하지 않습니다.

p-값이 유의 수준보다 크면 검정에서 적합성 결여를 탐지하지 않습니다.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오