예측에 대한 모든 통계량

회귀 방정식

반응과 모형의 항 간의 관계를 설명하려면 회귀 방정식을 사용합니다. 회귀 방정식은 회귀선의 대수적 표현입니다. 선형 모형에 대한 회귀 방정식 형식은 다음과 같습니다. Y= b0 + b1x1. 회귀 방정식에서 Y는 반응 변수, b0는 상수 또는 절편, b1은 선형 항에 대해 추정된 계수(선의 기울기라고도 함), x1은 항의 값입니다.

항이 두 개 이상인 회귀 방정식의 형식은 다음과 같습니다.

y = b0 + b1X1 + b2X2 + ... + bkXk

회귀 방정식에서 문자는 다음을 나타냅니다.
  • y는 반응 변수입니다.
  • b0은 상수입니다.
  • b1, b2, ..., bk는 계수입니다.
  • X1, X2, ..., Xk는 항의 값입니다. 각 항은 단일 예측 변수, 다항식 항 또는 교호작용 항입니다.

Minitab에서는 방정식과 변수 설정을 사용하여 적합치를 계산합니다.

변수 설정

Minitab에서는 회귀 방정식과 변수 설정을 사용하여 적합치를 계산합니다. 변수 설정이 모형을 추정하기 위해 사용된 데이터에 비해 비정상적인 경우 예측 아래에 경고가 표시됩니다.

분석을 제대로 수행했는지 확인하려면 변수 설정 표를 사용하십시오.

적합치

적합치는 라고도 합니다. 적합치는 지정된 예측 변수 값에 대한 평균 반응의 점 추정치입니다. 예측 변수의 값은 x-값이라고도 합니다. Minitab에서는 회귀 방정식과 변수 설정을 사용하여 적합치를 계산합니다.

Minitab에 표시하는 적합치의 유형은 모형 내 반응 변수의 유형에 따라 달라집니다. 예를 들어, Minitab에서는 계량형 또는 개수 측정값, 이항 데이터 또는 변동성 분석을(를) 사용하는 모형이 있는지 여부에 따라 평균, 확률 또는 표준 편차를 표시합니다.

해석

적합치는 x-값을 반응 변수에 대한 회귀 방정식에 입력하여 계산됩니다.

예를 들어 방정식이 y = 5 + 10x이면 x-값 2에 대한 적합치는 25(25 = 5 + 10(2))입니다.

SE 적합치

적합치의 표준 오차(SE 적합치)는 지정된 변수 설정에 대해 추정된 평균 반응의 변동량을 추정합니다. 평균 반응의 신뢰 구간 계산에는 적합치의 표준 오차가 사용됩니다. 표준 오차는 항상 음수가 아닙니다.

해석

평균 반응의 추정치 정확도를 측정하려면 적합치의 표준 오차를 사용하십시오. 표준 오차가 작을수록 예측된 평균 반응이 더 정확합니다. 예를 들어 한 분석가가 배송 시간을 예측하는 모형을 개발합니다. 변수 설정 집합 하나에 대해 모형은 평균 배송 시간을 3.80일로 예측합니다. 해당 설정에 대한 적합치의 표준 오차는 0.08일입니다. 두 번째 변수 설정 집합에 대해 모형은 적합치의 표준 오차가 0.02일인 동일한 평균 배송 시간을 산출합니다. 분석가는 두 번째 변수 설정 집합의 평균 배송 시간이 3.80일에 가깝다는 것을 더 신뢰할 수 있습니다.

적합치의 표준 오차를 적합치와 함께 사용하여 평균 반응의 신뢰 구간을 생성할 수 있습니다. 예를 들어 95% 신뢰 구간은 자유도에 따라 예측 평균의 위아래로 표준 오차의 약 2배만큼 확장됩니다. 배송 시간의 경우 표준 오차가 0.08일 때 예측된 평균인 3.80일에 대한 95% 신뢰 구간은 (3.64, 3.96)일입니다. 모집단 평균이 이 범위 안에 있다고 95% 신뢰할 수 있습니다. 표준 오차가 0.02일 때 95% 신뢰 구간은 (3.76, 3.84)일입니다. 두 번째 변수 설정 집합의 신뢰 구간은 표준 오차가 더 작기 때문에 더 좁습니다.

95% CI

적합치에 대한 신뢰 구간은 예측 변수 설정이 지정된 평균 반응에 해당할 가능성이 높은 값의 범위를 제공합니다.

해석

변수의 관측치에 대한 적합치의 추정치를 평가하려면 신뢰 구간을 사용합니다.

예를 들어 95% 신뢰 수준에서는 모형에 있는 변수의 지정된 값에 대한 모집단 평균이 신뢰 구간에 포함된다고 95% 확신할 수 있습니다. 신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 넓으면 미래 값의 평균에 대한 신뢰도가 낮다는 것을 나타냅니다. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오.

95% PI

예측 구간은 선택한 변수 설정의 조합에 대해 단일 미래 반응을 포함할 가능성이 있는 값의 범위입니다.

해석

예측의 정밀도를 평가하려면 예측 구간(PI)을 사용합니다. 예측 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 예측 구간이 허용되는 경계 밖으로 확장되면 예측이 요건에 대해 충분히 정밀하지 않을 수도 있습니다.

PI가 95%인 경우 단일 반응값이 사용자가 지정한 예측 변수 설정에서 주어진 구간에 포함될 것임을 95% 신뢰할 수 있습니다. 평균 반응에 대한 단일 반응을 예측하는 데 불확실성이 추가되므로 예측 구간은 항상 신뢰 구간보다 넓습니다.

예를 들어 한 가구 제조업체의 재료 엔지니어가 합판의 밀도를 사용하여 합판의 경도를 예측하는 단순 회귀 모형을 개발합니다. 이 엔지니어는 모형이 분석의 가정을 충족함을 확인합니다. 그런 다음, 분석가가 이 모형을 사용하여 경도를 예측합니다.

회귀 방정식에서는 밀도가 25인 새 관측치의 경도가 -21.53 + 3.541*25 = 66.995라고 예측합니다. 이 관측치의 경도가 정확히 66.995일 가능성은 별로 없지만, 예측 구간은 엔지니어가 실제 값이 대략 48에서 86 사이일 것이라고 95% 신뢰할 수 있음을 나타냅니다.