적합선 그림에 대한 주요 결과 해석

적합선 그림을 해석하려면 다음 단계를 수행하십시오. 주요 결과에는 p-값, 적합선 그림, R2 및 잔차 그림이 포함됩니다.

1단계: 반응과 항 사이의 연관성이 통계적으로 유의한지 확인

반응과 모형의 각 항 간의 연관성이 통계적으로 유의한지 여부를 확인하려면 항에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 항의 계수가 0으로, 항과 반응 간에 연관성이 없다는 것을 나타냅니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시됨)이 적절합니다. 0.05의 유의 수준은 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
P-값 ≤ α: 연관성이 통계적으로 유의함
p-값이 유의 수준보다 작거나 같으면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다. 2차 모형 또는 3차 모형을 적합시키고 2차 항 또는 3차 항이 유의한 경우 데이터에 곡면성이 포함되어 있다는 결론을 내릴 수 있습니다.
P-값 > α: 연관성이 통계적으로 유의하지 않음

p-값이 유의 수준보다 크면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다. 2차 모형 또는 3차 모형을 적합시키고 2차 항 또는 3차 항이 통계적으로 유의하지 않은 경우 다른 모형을 선택할 수도 있습니다.

분산 분석

출처DFSSMSFP
회귀212189.46094.70106.540.000
오차261487.357.21   
총계2813676.7     

순차적 분산 분석

출처DFSSFP
선형111552.8146.860.000
2차1636.611.130.003
주요 결과: P-값

이 결과에서 선형 항에 대한 p-값, 밀도는 0.000이고 2차 항에 대한 밀도2는 0.003입니다. 두 값은 모두 유의 수준 0.05보다 작습니다. 이 결과는 경도와 밀도 간의 연관성이 통계적으로 유의하다는 것을 나타냅니다.

2단계: 회귀선이 데이터를 적합하는지 여부 확인

모형이 데이터를 얼마나 잘 적합하는지, 모형이 목표를 충족하는지 여부를 평가하십시오. 다음과 같은 기준이 충족되는지 여부를 확인하려면 적합선 그림을 조사하십시오.
  • 표본에는 모든 예측 변수의 전체 범위에서 적절한 수의 관측치가 포함됩니다.
  • 모형이 데이터의 곡면성을 적절하게 적합합니다. 선형 모형을 적합하고 데이터에 곡면성이 보이는 경우 분석을 반복하고 2차 또는 3차 모형을 선택하십시오. 어느 모형이 가장 적합한지 확인하려면 그림과 적합도 통계량을 조사하십시오. 모형의 항이 통계적으로 유의한지 확인하려면 해당 항에 대한 p-값을 확인하고 공정 지식을 적용하여 실제적 유의성을 평가하십시오.
  • 결과에 중대한 영향을 미칠 수 있는 특이치를 찾아보십시오. 특이치의 원인을 식별해 보십시오. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오(특수 원인). 그런 다음 분석을 반복하십시오. 특이치 탐지에 대한 자세한 내용은 비정상적 관측치에서 확인하십시오.
이 적합선 그림에서 점들이 거의 회귀선을 따릅니다. 점들은 밀도 값의 전체 범위를 적절히 포함합니다. 그러나 그래프의 오른쪽 상단에 있는 점은 특이치인 것으로 보입니다. 원인을 확인하려면 이 점을 조사하십시오.

3단계: 항이 반응과 어떻게 연관되어 있는지 조사

항의 p-값이 유의하면 회귀 방정식과 계수를 조사하여 항이 반응과 어떻게 연관되어 있는지 확인할 수 있습니다.

모형의 반응과 항 사이에 존재하는 관계를 설명하려면 회귀 방정식을 사용합니다. 회귀 방정식은 회귀선의 대수적 표현입니다. 선형 모형에 대한 회귀 방정식의 형태는 다음과 같습니다. Y = b0 + b1x1. 회귀 방정식에서 Y는 반응 변수, b0는 상수 또는 절편, b1는 선형 항에 대해 추정된 계수(선의 기울기라고도 함), x1는 항의 값입니다.

항의 계수는 해당 항의 한 단위 변화에 대한 평균 반응의 변화를 나타냅니다. 계수의 부호는 항과 반응 간 관계의 방향을 나타냅니다. 계수가 음수이면 항이 증가함에 따라 반응의 평균 값이 감소합니다. 계수가 양수이면 항이 증가함에 따라 반응의 평균 값이 증가합니다.

예를 들어, 한 관리자가 회귀 모형 y = 130 + 4.3x를 사용하여 직원의 작업 기술 검정 점수를 예측할 수 있는지 확인합니다. 방정식에서 x는 사내 교육 시간(0-20)이고 y는 검정 점수입니다. 계수 또는 기울기는 4.3으로, 이는 1시간 교육에 대해 평균 검정 점수가 4.3점 증가한다는 것을 나타냅니다.

계수에 대한 자세한 내용은 회귀 계수에서 확인하십시오.

회귀 방정식
경도 = 12.70 - 1.517 밀도 + 0.1622 밀도^2

모형 요약

SR-제곱R-제곱(수정)
7.5634289.13%88.29%
주요 결과: 회귀 분석 방정식, 계수

예측 변수의 계수인 밀도는 -1.517이고 밀도2의 계수는 0.1622입니다. 따라서 2차 관계에서 합판의 평균 경도는 밀도 값이 작을 때보다 밀도 값이 클수록 더 빠르게 증가합니다.

4단계: 모형이 데이터를 얼마나 잘 적합시키는지 확인

모형이 데이터를 얼마나 잘 적합하는지 확인하려면 모형 요약 표의 적합도 통계량을 조사합니다.

R-제곱

R2은 모형에서 설명하는 반응의 변동 비율입니다.R2 값이 높을수록 모형이 데이터를 더 잘 적합시킵니다. R2 은 항상 0%에서 100% 사이입니다.

모형에 예측 변수를 추가하면 R2은 항상 증가합니다. 예를 들어, 최량 예측 변수가 5개인 모형은 최량 예측 변수가 4개인 모형보다 항상 R2 값이 큽니다. 따라서 R2은 같은 크기의 모형을 비교할 때 가장 유용합니다.

R-제곱(수정)

예측 변수 수가 다른 여러 모형을 비교하려면 수정 R2을 사용합니다. 모형에 예측 변수를 추가하면 모형이 실제로 개선되지 않더라도 R2은 항상 증가합니다. 수정 R2 값은 모형의 예측 변수 수에 통합되어 올바른 모형을 선택하는 데 도움이 됩니다.

R2 값을 비교할 때 다음과 같은 점을 고려하십시오.
  • 작은 표본은 반응과 예측 변수 간 관계의 강도에 대한 정확한 추정치를 제공하지 않습니다. 예를 들어, 더 정확한 R2이 필요하면 더 큰 표본을 사용해야 합니다(일반적으로 40 이상).

  • 적합도 통계량은 모형이 데이터를 얼마나 잘 적합시키는 지에 대한 하나의 측도에 지나지 않습니다. 모형에 만족스러운 값이 있더라도 해당 모형이 모형 가정을 충족하는지 확인하려면 잔차 그림을 확인해야 합니다.

회귀 방정식
경도 = 12.70 - 1.517 밀도 + 0.1622 밀도^2

모형 요약

SR-제곱R-제곱(수정)
7.5634289.13%88.29%
주요 결과: R-제곱

이 결과에서는 합판 밀도가 합판 경도 변동의 약 89%를 설명합니다. R2 값은 모형이 데이터를 잘 적합한다는 것을 나타냅니다.

5단계: 모형이 분석의 가정을 충족하는지 여부 확인

모형이 적절하고 분석의 가정을 충족하는지 여부를 확인하려면 잔차 그림을 사용하십시오. 가정이 충족되지 않으면 모형이 데이터에 적합하지 않은 것이므로 결과를 해석할 때 주의해야 합니다.

잔차 대 적합치 그림

잔차가 랜덤하게 분포되어 있고 잔차의 분산이 일정하다는 가정을 확인하려면 잔차 대 적합치 그림을 사용하십시오. 이상적으로는 점들이 식별 가능한 패턴 없이 0의 양쪽에 랜덤하게 분포해야 합니다.

다음 표의 패턴은 모형이 모형 가정을 충족하지 않음을 나타낼 수 있습니다.
패턴 패턴이 나타낼 수 있는 내용
적합치에 대해 잔차가 부채꼴 모양으로 흩어져 있거나 고르지 않게 퍼져 있음 일정하지 않은 분산
곡선 고차 항 누락
한 점이 0에서 멀리 떨어져 있음 특이치
다른 점에서 x 방향으로 멀리 떨어져 있는 점 영향력 있는 점
이 잔차 대 적합치 그림에서는 점들이 랜덤하게 흩어져 있는 것으로 보입니다. 그러나 오른쪽 위의 점은 특이치인 것으로 보입니다. 특이치의 원인을 식별해 보십시오. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오(특수 원인). 그런 다음 분석을 반복하십시오.

잔차 대 순서 그림

잔차가 서로 독립적이라는 가정을 확인하려면 잔차 대 순서 그림을 사용합니다. 독립 잔차는 시간순으로 표시될 때 아무런 추세나 패턴을 보이지 않습니다. 점들의 패턴은 서로 가까이 있는 잔차가 상관되어 있으며, 따라서 독립적이 아닐 수도 있음을 나타냅니다. 이상적으로는 그림의 잔차들이 중심선 주위에 랜덤하게 분포해야 합니다.
패턴이 있으면 원인을 조사하십시오. 다음 유형의 패턴은 잔차가 종속적이라는 것을 나타낼 수도 있습니다.
추세
이동
주기
이 잔차 대 순서 그림에서는 점들이 중심선 주위에 랜덤하게 위치한 것으로 보입니다. 워크시트의 15, 21 및 23행의 관측치에 해당하는 점은 더 큰 잔차를 갖습니다.

정규 확률도

잔차가 정규 분포를 따른다는 가정을 확인하려면 잔차의 정규 확률도를 사용합니다. 잔차의 정규 확률도는 대략 직선을 따라야 합니다.

다음 표의 패턴은 모형이 모형 가정을 충족하지 않음을 나타낼 수 있습니다.
패턴 패턴이 나타낼 수 있는 내용
직선이 아님 비정규성
선에서 멀리 떨어져 있는 점 특이치
기울기 변화 식별되지 않은 변수
이 정규 확률도에서는 잔차가 직선에서 약간 벗어납니다. 그러나 데이터에 15점 이상이 포함되어 있는 경우 일반적으로 신뢰할 수 있는 p-값 계산에 문제가 되지 않습니다.

잔차 그림에서 패턴을 처리하는 방법에 대한 자세한 내용은 적합선 그림의 잔차 그림에서 확인하십시오.