적합선 그림에 대한 적합선 그림

적합선 그림에 대한 정의 및 해석을 확인해 보십시오.

적합선 그림

적합선 그림에는 반응과 예측 데이터가 표시됩니다. 이 그림에는 회귀 방정식을 나타내는 회귀선이 포함됩니다. 또한 그림에 95% 신뢰 구간과 예측 구간을 표시할 수도 있습니다.

해석

모형이 데이터를 얼마나 잘 적합하는지, 모형이 목표를 충족하는지 여부를 평가하십시오. 다음과 같은 기준이 충족되는지 여부를 확인하려면 적합선 그림을 조사하십시오.
  • 표본에는 모든 예측 변수의 전체 범위에서 적절한 수의 관측치가 포함됩니다.
  • 모형이 데이터의 곡면성을 적절하게 적합합니다. 선형 모형을 적합하고 데이터에 곡면성이 보이는 경우 분석을 반복하고 2차 또는 3차 모형을 선택하십시오. 어느 모형이 가장 적합한지 확인하려면 그림과 적합도 통계량을 조사하십시오. 모형의 항이 통계적으로 유의한지 확인하려면 해당 항에 대한 p-값을 확인하고 공정 지식을 적용하여 실제적 유의성을 평가하십시오.
  • 결과에 중대한 영향을 미칠 수 있는 특이치를 찾아보십시오. 특이치의 원인을 식별해 보십시오. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오(특수 원인). 그런 다음 분석을 반복하십시오. 특이치 탐지에 대한 자세한 내용은 비정상적 관측치에서 확인하십시오.

회귀 방정식

반응과 모형의 항 간의 관계를 설명하려면 회귀 방정식을 사용합니다. 회귀 방정식은 회귀선의 대수적 표현입니다. 선형 모형에 대한 회귀 방정식 형식은 다음과 같습니다. Y= b0 + b1x1. 회귀 방정식에서 Y는 반응 변수, b0는 상수 또는 절편, b1은 선형 항에 대해 추정된 계수(선의 기울기라고도 함), x1은 항의 값입니다.

항이 두 개 이상인 회귀 방정식의 형식은 다음과 같습니다.

y = b0 + b1X1 + b2X2 + ... + bkXk

회귀 방정식에서 문자는 다음을 나타냅니다.
  • y는 반응 변수입니다.
  • b0은 상수입니다.
  • b1, b2, ..., bk는 계수입니다.
  • X1, X2, ..., Xk는 항의 값입니다.

방정식 계수

회귀 계수는 예측 변수와 반응 변수 간의 관계 크기와 방향을 설명합니다. 계수는 회귀 방정식에서 항의 값에 곱하는 숫자입니다.

해석

항의 계수는 해당 항의 한 단위 변화에 대한 평균 반응의 변화를 나타냅니다. 계수의 부호는 항과 반응 간 관계의 방향을 나타냅니다. 계수가 음수이면 항이 증가함에 따라 반응의 평균 값이 감소합니다. 계수가 양수이면 항이 증가함에 따라 반응의 평균 값이 증가합니다.

예를 들어, 한 관리자가 회귀 모형 y = 130 + 4.3x를 사용하여 직원의 작업 기술 검정 점수를 예측할 수 있는지 확인합니다. 방정식에서 x는 사내 교육 시간(0-20)이고 y는 검정 점수입니다. 계수 또는 기울기는 4.3으로, 이는 1시간 교육에 대해 평균 검정 점수가 4.3점 증가한다는 것을 나타냅니다.

계수 크기는 일반적으로 하나의 항이 반응 변수에 미치는 영향의 실제적 유의성을 평가하는 좋은 방법입니다. 그러나 유의성에 대한 계산에서는 반응 데이터의 변동도 고려하기 때문에 계수 크기는 항이 통계적으로 유의한지 여부를 나타냅니다. 통계적 유의성을 확인하려면 항에 대한 p-값을 조사하십시오.

95% CI

적합치에 대한 신뢰 구간은 예측 변수 설정이 지정된 평균 반응에 해당할 가능성이 높은 값의 범위를 제공합니다.

해석

신뢰 구간은 관측된 변수 값에 대한 적합치를 추정하는 데 사용합니다.

예를 들어 95% 신뢰 수준에서는 모형에 있는 변수의 지정된 값에 대한 모집단 평균이 신뢰 구간에 포함된다고 95% 확신할 수 있습니다. 신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 넓으면 미래 값 평균의 신뢰도가 더 낮을 수 있음을 나타냅니다. 신뢰 구간이 너무 넓어서 유의하지 않은 경우 표본 크기를 늘려보십시오.

95% PI

예측 구간은 예측 변수의 값에 대해 단일 미래 반응을 포함할 가능성이 있는 값의 범위입니다.

해석

예측 구간이 95%인 경우 새로운 관측치가 보라색 선으로 표시된 구간에 포함될 것임을 95% 신뢰할 수 있습니다. (그러나 이것은 분석에 포함된 범위 내에 있는 밀도 값에만 해당됩니다.)

예를 들어 한 가구 제조업체의 재료 엔지니어가 합판의 밀도를 사용하여 합판의 경도를 예측하는 단순 회귀 모형을 개발합니다. 이 엔지니어는 모형이 분석의 가정을 충족함을 확인합니다. 그런 다음, 분석가가 이 모형을 사용하여 경도를 예측합니다.

회귀 방정식에서는 밀도가 20인 새 관측치의 경도가 20 is 12.70 – 1.517*20 + 0.1622*202 = 47.24라고 예측합니다. 이 관측치의 경도가 정확히 47.24일 가능성은 별로 없지만, 예측 구간은 엔지니어가 실제 값이 대략 31에서 63 사이일 것이라고 95% 신뢰할 수 있음을 나타냅니다.

예측 구간은 항상 해당하는 신뢰 구간보다 넓습니다. 이 예에서 95% 신뢰 구간은 엔지니어가 평균 경도가 대략 43에서 50 사이일 것이라고 95% 신뢰할 수 있음을 나타냅니다.