기본적으로 Minitab에서는 회귀 분석에 (1,0) 코드화 방법을 사용하지만 코드화 하위 대화 상자에서 (-1, 0, +1) 코드화 방법으로 변경할 수 있습니다. 자세한 내용은 범주형 예측 변수의 코드화 방법에서 확인하십시오.
먼저 요인 수준이 3개인 균형 1-요인 설계를 고려해 보겠습니다.
C1 | C2 - T |
---|---|
반응 | 요인 |
1 | A |
3 | A |
2 | A |
2 | A |
4 | B |
6 | B |
3 | B |
5 | B |
8 | C |
9 | C |
7 | C |
10 | C |
평균에 집중하여 기술 통계량을 조사합니다.
추정되는 회귀 방정식은 다음과 같습니다.
수준 C가 기준 수준이므로, 계수가 0입니다. 요인이 하나뿐인 경우 절편은 기준 수준의 평균과 같습니다.
수준 A에 해당하는 계수는 –6.5입니다. 이는 수준 A와 기준 수준 간의 차이입니다. A에 대한 계수에 절편(또는 기준 평균)을 더하면 수준 A에 대한 평균을 얻게 됩니다(–6.5 + 8.5 = 2.0).
마찬가지로, 수준 B에 해당하는 계수는 –4.0입니다. 이는 수준 B와 기준 수준 간의 차이입니다. 수준 B에 대한 계수에 절편을 더하면 수준 B에 대한 평균을 얻게 됩니다(–4.0 + 8.5 = 4.5).
회귀 방정식:
절편은 전체 평균입니다.
A에 대한 계수는 요인 수준 A의 효과입니다. 이는 수준 A에 대한 평균과 전체 평균 간의 차이입니다.
B에 대한 계수는 요인 수준 B의 효과입니다. 이는 수준 B에 대한 평균과 전체 평균 간의 차이입니다.
절편을 제외하고 계수를 모두 더하고 -1을 곱하면 수준 C의 효과 크기를 얻을 수 있습니다(-1 * [(-3.0) + (-0.5)] = 3.5).
이제 요인 수준이 세 개인 첫 번째 요인과 요인 수준이 두 개인 두 번째 요인이 있는 균형 2-요인 설계를 고려해 보겠습니다.
C1 | C2 - T | C3 - T |
---|---|---|
반응 | 요인 1 | 요인 2 |
1 | A | 많음 |
3 | A | 낮음 |
2 | A | 많음 |
2 | A | 낮음 |
4 | B | 많음 |
6 | B | 낮음 |
3 | B | 많음 |
5 | B | 낮음 |
8 | C | 많음 |
9 | C | 낮음 |
7 | C | 많음 |
10 | C | 낮음 |
평균에 집중하여 기술 통계량을 조사합니다.
추정되는 회귀 방정식은 다음과 같습니다.
수준 A에 해당하는 계수는 다시 –6.5입니다. 이는 여전히 수준 A와 기준 수준(수준 C) 간의 거리입니다. 수준 A에 대한 평균에서 기준 수준에 대한 평균을 빼면 계수가 얻어집니다(2 – 8.5 = -6.5).
마찬가지로, 수준 B에 해당하는 계수는 여전히 –4.0입니다. 이는 요인 1에 대한 수준 B와 기준 수준 간의 거리입니다. 수준 B에 대한 평균에서 기준 수준에 대한 평균을 빼면 계수를 얻게 됩니다(4.5 - 8.5 = -4.0).
마지막으로, 요인 2의 높음 수준에 해당하는 계수는 "높음"과 요인 2의 기준 수준(낮음) 간의 거리입니다. 따라서 요인 2의 높음 수준에 대한 평균에서 요인 2의 기준 수준에 대한 평균을 빼면 계수가 얻어집니다(4.1667 – 5.8333 = -1.667).
이 코드화 방법을 사용하는 경우 계수가 1-요인 모형에서 변경되지 않습니다. 이제 두 번째 요인에 대한 추가 계수를 갖게 됩니다.
회귀 방정식:
수준이 두 개뿐이고 표본 크기가 같은 경우, 평균이 정확히 가운데 있기 때문에 수준 효과의 크기가 같습니다.
절편은 전체 평균입니다.
계수는 각 요인 수준의 효과입니다. 이것은 해당 수준에 대한 평균과 전체 평균 간의 차이를 나타냅니다.