다음과 같은 선형, 2차 또는 3차 회귀 모형을 적합시킬 수 있습니다.
모형 유형 | 주문 | 통계적 모형 |
---|---|---|
선형 | 첫 번째 | Y = β0+ β1x + e |
2차 | 두 번째 | Y = β0+ β1x + β2x2+ e |
3차 | 세 번째 | Y = β0+ β1x + β2x2+ β3x3+ e |
곡면성을 모형화하는 또 한 가지 방법은 x 및/또는 y의 log10을 사용하여 선형, 2차 또는 3차 모형에 대한 추가 모형을 생성하는 것입니다. 또한 Y의 log10을 취하여 오른쪽 치우침 또는 일정하지 않은 잔차의 분산을 줄일 수 있습니다.
Minitab에서는 2차 또는 3차 모형을 적합하는 경우 계수를 추정하기 전에 예측 변수를 표준화합니다. 표준화하면 예측 변수 간 다중 공선성이 감소합니다. 이 경우 Minitab이 모형에서 예측 변수를 제외할 수 없을 정도로 다중 공선성이 낮아집니다. 결과에서는 표준화되지 않은 계수를 예측 변수의 원래 단위로 보여줍니다."
단순 선형 회귀 분석의 계수 또는 기울기 공식은 다음과 같습니다.
절편(b0)의 공식은 다음과 같습니다.
행렬 항에서 다중 회귀 분석의 계수 벡터를 계산하는 공식은 다음과 같습니다.
b = (X'X)-1X'y
용어 | 설명 |
---|---|
yi | i번째 관측 반응 값 |
![]() | 평균 반응 |
xi | i번째 예측 변수 값 |
![]() | 평균 예측 변수 |
X | 설계 행렬 |
y | 반응 행렬 |
용어 | 설명 |
---|---|
MSE | 평균 제곱 오차 |
R2은 또한 y와 의 상관 계수 제곱으로 계산할 수도 있습니다.
용어 | 설명 |
---|---|
SS | 제곱합 |
y | 반응 변수 |
![]() | 적합 반응 변수 |
용어 | 설명 |
---|---|
MS | 평균 제곱 |
SS | 제곱합 |
DF | 자유도 |
모형의 각 구성 요소에 대한 자유도는 다음과 같습니다.
변동 출처 | DF |
---|---|
회귀 분석 | p |
오류 | n – p – 1 |
합계 | n – 1 |
용어 | 설명 |
---|---|
n | 관측치 수 |
p | 모형의 계수 수(상수 제외) |
거리 제곱의 합입니다. SS 회귀 분석은 모형에 의해 설명되는 분산의 비율입니다. SS 오차는 모형에 의해 설명되지 않으며 오차로 인한 비율입니다. SS 전체는 데이터의 총 변동입니다.
용어 | 설명 |
---|---|
yi | i번째 관측된 반응 값 |
![]() | i번째 적합 반응 |
![]() | 평균 반응 |
오차의 평균 제곱(MS 오차 또는 MSE로 줄이고 s2로 표기함)은 적합 회귀선 주변의 분산입니다. 공식은 다음과 같습니다.
용어 | 설명 |
---|---|
yi | i번째 관측된 반응 값 |
![]() | ith번째 적합 반응 |
n | 관측치 수 |
p | 상수를 제외한 모형 내 계수의 수 |
회귀 분석의 평균 제곱(MS)에 대한 공식은 다음과 같습니다.
용어 | 설명 |
---|---|
![]() | 평균 반응 |
![]() | i번째 적합 반응 |
p | 모형의 항 수 |
평균 제곱(MS) 합계 공식은 다음과 같습니다.
용어 | 설명 |
---|---|
![]() | 평균 반응 |
yi | i번째 관측 반응 값 |
n | 관측치 수 |
F-통계량 공식은 다음과 같습니다.
용어 | 설명 |
---|---|
MS 회귀 분석 | 현재 모형이 설명하는 반응 변동의 측도. |
MS 오차 | 모형이 설명하지 않는 변동의 측도. |
MS 항 | 모형의 나머지 항을 고려한 후 항이 설명하는 변동 양의 측도. |
MS 적합성 결여 | 모형에 더 많은 항을 추가하여 모형화할 수 있는 반응의 변동 측도. |
MS 순수 오차 | 반복된 반응 데이터의 변동 측도. |
p-값은 자유도(DF)가 다음과 같은 F 분포에서 계산되는 확률입니다.
1 − P(F ≤ fj)
용어 | 설명 |
---|---|
P(F ≤ f) | F-분포의 누적분포함수 |
f | 검정에 대한 f-통계량 |
용어 | 설명 |
---|---|
ei | i번째 잔차 |
![]() | i번째 관측된 반응 값 |
![]() | i번째 적합 반응 |