공변량은 일반적으로 분석 분석과 실험계획법에 사용됩니다. 이러한 모형에서 공변량은 데이터를 수집하는 동안 제어되지 않는 계량형 변수입니다. 공변량을 포함하면 모형에 실험에서 측정되었지만 랜덤화되거나 제어되지 않은 입력 변수를 포함하고 이에 대해 조정할 수 있습니다. 공변량을 추가하면 모형의 정확도가 크게 개선되며 최종 분석 결과에 유의한 영향을 미칠 수 있습니다. 모형에 공변량을 추가하면 모형의 오차를 줄여 요인 검정의 검정력을 늘릴 수 있습니다. 일반적인 공변량으로는 주변 온도, 습도 및 처리를 적용하기 전의 부품 또는 대상의 특성 등이 있습니다.
예를 들어, 한 엔지니어가 네 가지 철강 빔의 부식 수준을 연구하려고 합니다. 엔지니어는 부식 속도를 빠르게 하기 위해 각 빔을 액체 처리제에 노출하지만, 액체의 온도는 제어할 수 없습니다. 온도는 모형에서 고려해야 하는 공변량입니다.
실험계획법에서 엔지니어는 두 가지 유형의 페인트 건조 시간에 대한 공변량, 대기 온도의 효과에 관심이 있을 수도 있습니다.
한 섬유 회사에서 세 대의 기계를 사용하여 단섬유를 제조합니다. 회사에서는 섬유의 파손 강도가 기계별로 다른지 여부를 확인하려고 합니다. 회사에서는 각 기계에서 랜덤하게 추출한 5개 섬유의 강도 및 지름에 대한 데이터를 수집합니다. 섬유 강도는 지름과 관련이 있기 때문에 공변량으로 사용할 경우를 위해 섬유 지름도 기록합니다.
C1 | C2 | C3 |
---|---|---|
기계 | 지름 | 강도 |
1 | 20 | 36 |
1 | 25 | 41 |
1 | 24 | 39 |
1 | 25 | 42 |
1 | 32 | 49 |
2 | 22 | 40 |
2 | 28 | 48 |
2 | 22 | 39 |
2 | 30 | 45 |
2 | 28 | 44 |
3 | 21 | 35 |
3 | 23 | 37 |
3 | 26 | 42 |
3 | 21 | 34 |
3 | 15 | 32 |
섬유 생산 데이터에 대해 Minitab에서는 다음 결과를 표시합니다.
기계에 대한 F-통계량은 2.61이고 p-값은 0.118입니다. p-값이 0.05보다 크기 때문에 5% 유의 수준에서 기계별로 섬유 강도가 다르다는 귀무 가설을 기각할 수 없습니다. 모든 기계의 섬유 강도가 동일하다고 가정할 수 있습니다. 지름(공변량)의 F-통계량은 69.97이고 p-값은 0.000입니다. 이는 공변량 효과가 유의하다는 것을 나타냅니다. 즉, 지름이 섬유 강도에 유의한 영향을 미칩니다.
이제 공변량을 제외하고 분석을 다시 실행한다고 가정합니다. 이 경우 다음과 같은 결과가 표시됩니다.
F-통계량은 4.09이고 p-값은 0.044입니다. 모형에 공변량이 없는 경우 5% 유의 수준에서 귀무 가설을 기각하고 기계별로 섬유 강도가 다르다는 결론을 내릴 수 있습니다.
이 결론은 공변량을 사용하여 분석을 수행할 때와 완전히 반대입니다. 이 예는 공변량을 포함하지 않을 경우 잘못된 분석 결과가 나올 수 있다는 것을 보여줍니다.