세 개 이상의 요인에 대한 균형 분산 분석 모형은 이원 분산 분석 모형을 간단히 확장한 것입니다.
요인 A, B, C가 포함된 3-요인 균형 분산 분석 모형은 다음과 같습니다.
yijkm = μ + α i+ β j + γ k + (αβ)ij+ (αγ)ik+ (βγ)jk+ (αβγ)ijk+εijkm
요인이 고정 요인인 경우 Σαi = 0, Σβj = 0, Σγk = 0, Σ(αβ)ij = 0, Σ(αγ)ik = 0, Σ(βγ)jk = 0, Σ(αβγ)ijk = 0이고 εijkm는 독립 N(0, σ2)입니다.
요인이 변량 요인인 경우 α i, β j , γk, (αβ)ij, (αγ)ik, (βγ)jk, (αβγ)ijk이고 εijkm은 독립 랜덤 변수입니다. 변수들은 평균이 0이고 분산이 V(αi) = σ2α,V(β j) = σ2β,V(γk) = σ2γ, V[(αβ)ij] = σ2αβ, V[(αγ)jk] = σ2αγ, V[(βγ)jk] = σ2βγ, V(εijkm) = σ2인 정규 분포를 따릅니다.
요인이 세 개인 모형은 요인이 네 개 이상인 모형으로 확장할 수 있습니다.
지정된 수준에서 요인에 대한 관측치의 평균입니다. 공식은 다음과 같습니다.
요인 A의 평균:
요인 B의 평균:
요인 C의 평균:
전체 평균:
용어 | 설명 |
---|---|
yi... | A의 i번째 요인 수준에 대한 모든 관측치의 합 |
y.j.. | B의 j번째 요인 수준에 대한 모든 관측치의 합 |
y..k. | C의 k번째 요인 수준에 대한 모든 관측치의 합 |
y.... | 표본 내 모든 관측치의 합 |
a | A의 수준 수 |
b | B의 수준 수 |
c | C의 수준 수 |
n | 요인과 수준의 각 조합에서의 관측치 수 |
거리 제곱의 합입니다. SS 전체는 데이터의 총 변동입니다. SS (A), SS (B), SS (C)는 추정된 요인 수준 평균의 전체 평균으로부터의 변동량을 나타냅니다. 처리 간 제곱합이라고도 합니다. SS(AB), SS(AC), SS(BC) 및 SS(ABC)는 각 교호작용 항이 설명하는 변동량을 나타냅니다. SS 오차는 적합치와 실제 관측치 간의 변동량을 나타냅니다. 처리 내 오차라고도 합니다. 이 공식에서는 완전 모형이 적합하다고 가정합니다. 다음과 같이 계산됩니다.
용어 | 설명 |
---|---|
a | 요인 A의 수준 수 |
b | 요인 B의 수준 수 |
c | 요인 C의 수준 수 |
n | 총 시행 횟수 |
![]() | 요인 A의 i번째 요인 수준의 평균 |
![]() | 모든 관측치의 전체 평균 |
![]() | 요인 B의 j번째 요인 수준의 평균 |
![]() | 요인 C의 k번째 요인 수준의 평균 |
![]() | 추정된 처리 평균 |
모형의 각 성분에 대한 자유도는 다음과 같습니다.
변동 원인 | DF |
---|---|
요인 | ki – 1 |
공변량 및 공변량 간의 교호작용 | 1 |
요인이 포함된 교호작용 | ![]() |
회귀 분석 | p |
오차 | n – p – 1 |
합계 | n – 1 |
용어 | 설명 |
---|---|
ki | i번째 요인의 수준 수 |
m | 요인 수 |
n | 관측치 수 |
p | 상수를 제외한 모형 내 계수의 수 |
요인이 모두 고정 요인인 3-요인 분산 분석의 경우 완전 모형의 F-통계량에 대한 공식은 다음과 같습니다.
모형에 변량 요인이 있는 경우 각 항에 대한 F 비율은 각 항에 대한 기대 평균 제곱에 의해 결정됩니다.
F 값이 더 크면 귀무 가설을 기각하게 됩니다. 효과가 통계적으로 유의하다는 결론을 내릴 수 있습니다.
p-값은 자유도(DF)가 다음과 같은 F 분포에서 계산되는 확률입니다.
1 − P(F ≤ fj)
용어 | 설명 |
---|---|
P(F ≤ f) | F-분포의 누적분포함수 |
f | 검정에 대한 f-통계량 |
용어 | 설명 |
---|---|
MSE | 평균 제곱 오차 |
R2은 결정 계수라고도 합니다.
용어 | 설명 |
---|---|
yi | i번째 관측된 반응 값 |
![]() | 평균 반응 |
![]() | i번째 적합 반응 |
계산 결과 수정된 R2 값이 음수가 될 수 있지만, Minitab에서는 이 경우 0을 표시합니다.
용어 | 설명 |
---|---|
![]() | i번째 관측된 반응 값 |
![]() | i번째 적합 반응 |
![]() | 평균 반응 |
n | 관측치 수 |
p | 모형의 항 수 |
여기서 αi, βj , (αβ)ij, εijk는 독립적인 랜덤 변수입니다. 이 변수들은 평균이 0이고 분산이 아래 공식으로 지정되는 정규 분포를 따릅니다.
이러한 분산이 분산 성분입니다. 이 경우 분산 성분이 0이라는 가설을 검정하십시오.
요인이 두 개인 제한된 혼합 모형의 경우 모형은 다음과 같습니다.
여기서 αi는 고정 효과, βj는 랜덤 효과, (αβ)ij는 랜덤 효과, εijk는 랜덤 오차입니다. 각 j에 대해 Σα i = 0이고 Σ(αβ)ij = 0입니다. 분산은 V(βj) = σ2β,V[(αβ)ij] =[(a - 1)/a]σ2αβ 및 V(εijk) = σ2입니다. σ2β, σ2αβ 및 σ2는 분산 성분입니다. 고정 요인에 대한 교호작용 성분을 합하면 0으로, 이 모형이 제한된 혼합 모형이라는 것을 나타냅니다.
고정 요인 A, 변량 요인 B가 포함된 제한되지 않는 혼합 모형의 경우 다음 공식이 모형을 설명합니다.
여기서 αi는 고정 효과이고 βj, (αβ)ij 및 εijk는 평균이 0이고 분산이 다음과 같은 상관 관계가 없는 랜덤 변수입니다.
이러한 분산이 분산 성분입니다. 각 j에 대해 Σα i = 0이고 Σ(αβ)ij = 0입니다.
이 정보는 균형 모형에 대한 것입니다. 불균형적이거나 더 복잡한 모형에 대한 정보는 Montgomery1 및 Neter2를 참조하십시오.
두 요인 A(고정), B(변량)가 포함된 제한된 혼합 모형의 기대 평균 제곱에 대한 공식은 다음과 같습니다.
고정 요인 A, 변량 요인 B가 포함된 제한되지 않는 혼합 모형의 기대 평균 제곱에 대한 공식은 다음과 같습니다.
기대 평균 제곱 계산에 대한 일반 규칙 및 불균형적이거나 더 복잡한 모형에 대한 정보는 Montgomery1 및 Neter2를 참조하십시오.
용어 | 설명 |
---|---|
b | 요인 B의 수준 수 |
a | 요인 A의 수준 수 |
n | 관측치 수 |
σ2 | 모형의 추정 분산 |
![]() | A의 추정 분산 |
![]() | B의 추정 분산 |
![]() | AB의 추정 분산 |
![]() | A의 고정 효과 |
각 F-통계량은 평균 제곱의 비율입니다. 분자는 항에 대한 평균 제곱입니다. 분모는 분자 평균 제곱의 기대값이 분모 평균 제곱의 기대값과 중요한 효과만큼만 다르도록 선택됩니다. 랜덤 항에 대한 효과는 항의 분산 성분으로 표시됩니다. 고정된 항의 효과는 해당 항과 연관된 모형 성분의 제곱합을 자유도로 나눈 값으로 표시됩니다. 따라서 높은 F-통계량은 유의한 효과를 나타냅니다.
모형의 모든 항이 고정되어 있는 경우 각 F-통계량의 분모는 잔차의 평균 제곱(MSE)입니다. 그러나 랜덤 항을 포함하는 모형의 경우 MSE는 올바른 오차항이 아닐 수도 있습니다. 기대 평균 제곱(EMS)은 어느 항이 분모로 적절한지 확인하기 위해 사용할 수 있습니다.
출처 | 각 항에 대한 기대 평균 제곱 |
---|---|
(1) 화면 | (4) + 2.0000(3) + Q[1] |
(2) 기술 | (4) + 2.0000(3) + 4.0000(2) |
(3) 화면*기술 | (4) + 2.0000(3) |
(4) 오차 | (4) |
괄호 안의 숫자는 출처 번호 옆에 나열된 항과 연관된 랜덤 효과를 나타냅니다. (2)는 '기술'의 랜덤 효과, (3)은 화면*기술 교호작용의 랜덤 효과, (4)는 '오차'의 랜덤 효과를 나타냅니다. '오차'에 대한 EMS는 오차항의 효과입니다. 또한 화면*기술에 대한 EMS는 오차항의 효과에 화면*기술 교호작용 효과의 두 배를 더한 것입니다.
화면*기술에 대한 F-통계량을 계산하기 위해 분자의 기대값(화면*기술에 대한 EMS = (4) + 2.0000(3))이 분모의 기대값(오차에 대한 EMS = (4))과 교호작용의 효과(2.0000(3))만큼만 다르도록 화면*기술에 대한 평균 제곱을 오차의 평균 제곱으로 나눕니다. 따라서 높은 F-통계량은 유의한 화면*기술 교호작용을 나타냅니다.
Q[ ] 안의 숫자는 출처 번호 옆에 나열된 항과 연관된 고정 효과를 나타냅니다. 예를 들어, Q[1]은 화면의 고정 효과입니다. 화면에 대한 EMS는 오차항 효과에 화면*기술 교호작용 효과의 두 배, 화면 효과의 상수 배를 더한 것입니다. Q[1]은 (b*n * sum((화면 수준에 대한 계수)**2))를 (a - 1)로 나눈 값입니다. 여기서 a와 b는 각각 화면과 기술의 수준 수이며 n은 반복실험의 수입니다.
화면에 대한 F-통계량을 계산하기 위해 분자의 기대값(화면에 대한 EMS = (4) + 2.0000(3) + Q[1])이 분모의 기대값(화면*기술에 대한 EMS = (4) + 2003(3))과 화면(Q[1])으로 인한 효과만큼만 다르도록 화면에 대한 평균 제곱을 화면*기술에 대한 평균 제곱으로 나눕니다. 따라서 높은 F-통계량은 유의한 화면 효과를 나타냅니다.
항에 대한 정확한 F-검정은 분자 평균 제곱의 기대값이 분모 평균 제곱의 기대값과 분산 성분 또는 중요한 고정 요인만큼만 다른 검정입니다.
그러나 경우에 따라 이러한 평균 제곱을 계산할 수 없습니다. 이 경우 Minitab에서는 근사 F-검정을 생성하는 평균 제곱을 사용하고 F-검정이 정확하지 않다는 것을 나타내기 위해 p-값 옆에 "x"를 표시합니다.
출처 | 각 항에 대한 기대 평균 제곱 |
---|---|
(1) 첨가제 | (4) + 1.7500(3) + Q[1] |
(2) 호수 | (4) + 1.7143(3) + 5.1429(2) |
(3) 첨가제*호수 | (4) + 1.7500(3) |
(4) 오차 | (4) |
첨가제에 대한 F-통계량은 첨가제에 대한 평균 제곱을 첨가제*호수 교호작용에 대한 평균 제곱으로 나눈 값입니다. 첨가제에 대한 효과가 아주 작으면 분자의 기대값이 분모의 기대값과 같습니다. 이것이 정확한 F-검정의 예입니다.
그러나 호수 효과가 아주 작은 경우에는 분자의 기대값이 분모의 기대값과 같게 되는 평균 제곱이 없습니다. 따라서 Minitab에서는 근사 F-검정을 사용합니다. 이 예에서는 호수에 대한 평균 제곱을 첨가제*호수에 대한 평균 제곱으로 나눕니다. 그 결과 호수 효과가 아주 작은 경우 분자의 기대값이 분모의 기대값과 거의 같게 됩니다.
수정된 MS 값이 아주 작기 때문에 F-값과 p-값을 표시하기에 정밀도가 충분하지 않습니다. 해결 방법은 반응 열에 10을 곱하는 것입니다. 그런 다음 새 반응 열을 반응으로 사용하여 동일한 회귀 모형을 수행하십시오.
반응 값에 10을 곱해도 Minitab에서 출력을 표시하는 F-값과 p-값은 영향을 받지 않습니다. 그러나 나머지 출력, 특히 순차 제곱합, 수정 SS, 수정 MS, 적합치, 적합치의 표준 오차 및 잔차 열의 경우 소숫점 위치는 영향을 받습니다.
각 F-통계량은 평균 제곱의 비율입니다. 분자는 항에 대한 평균 제곱입니다. 분모는 분자 평균 제곱의 기대값이 분모 평균 제곱의 기대값과 중요한 효과만큼만 다르도록 선택됩니다. 랜덤 항에 대한 효과는 항의 분산 성분으로 표시됩니다. 고정된 항의 효과는 해당 항과 연관된 모형 성분의 제곱합을 자유도로 나눈 값으로 표시됩니다. 따라서 높은 F-통계량은 유의한 효과를 나타냅니다.
모형의 모든 항이 고정되어 있는 경우 각 F-통계량의 분모는 잔차의 평균 제곱(MSE)입니다. 그러나 랜덤 항을 포함하는 모형의 경우 MSE는 올바른 오차항이 아닐 수도 있습니다. 기대 평균 제곱(EMS)은 어느 항이 분모로 적절한지 확인하기 위해 사용할 수 있습니다.
출처 | 각 항에 대한 기대 평균 제곱 |
---|---|
(1) 화면 | (4) + 2.0000(3) + Q[1] |
(2) 기술 | (4) + 2.0000(3) + 4.0000(2) |
(3) 화면*기술 | (4) + 2.0000(3) |
(4) 오차 | (4) |
괄호 안의 숫자는 출처 번호 옆에 나열된 항과 연관된 랜덤 효과를 나타냅니다. (2)는 '기술'의 랜덤 효과, (3)은 화면*기술 교호작용의 랜덤 효과, (4)는 '오차'의 랜덤 효과를 나타냅니다. '오차'에 대한 EMS는 오차항의 효과입니다. 또한 화면*기술에 대한 EMS는 오차항의 효과에 화면*기술 교호작용 효과의 두 배를 더한 것입니다.
화면*기술에 대한 F-통계량을 계산하기 위해 분자의 기대값(화면*기술에 대한 EMS = (4) + 2.0000(3))이 분모의 기대값(오차에 대한 EMS = (4))과 교호작용의 효과(2.0000(3))만큼만 다르도록 화면*기술에 대한 평균 제곱을 오차의 평균 제곱으로 나눕니다. 따라서 높은 F-통계량은 유의한 화면*기술 교호작용을 나타냅니다.
Q[ ] 안의 숫자는 출처 번호 옆에 나열된 항과 연관된 고정 효과를 나타냅니다. 예를 들어, Q[1]은 화면의 고정 효과입니다. 화면에 대한 EMS는 오차항 효과에 화면*기술 교호작용 효과의 두 배, 화면 효과의 상수 배를 더한 것입니다. Q[1]은 (b*n * sum((화면 수준에 대한 계수)**2))를 (a - 1)로 나눈 값입니다. 여기서 a와 b는 각각 화면과 기술의 수준 수이며 n은 반복실험의 수입니다.
화면에 대한 F-통계량을 계산하기 위해 분자의 기대값(화면에 대한 EMS = (4) + 2.0000(3) + Q[1])이 분모의 기대값(화면*기술에 대한 EMS = (4) + 2003(3))과 화면(Q[1])으로 인한 효과만큼만 다르도록 화면에 대한 평균 제곱을 화면*기술에 대한 평균 제곱으로 나눕니다. 따라서 높은 F-통계량은 유의한 화면 효과를 나타냅니다.
항에 대한 정확한 F-검정은 분자 평균 제곱의 기대값이 분모 평균 제곱의 기대값과 분산 성분 또는 중요한 고정 요인만큼만 다른 검정입니다.
그러나 경우에 따라 이러한 평균 제곱을 계산할 수 없습니다. 이 경우 Minitab에서는 근사 F-검정을 생성하는 평균 제곱을 사용하고 F-검정이 정확하지 않다는 것을 나타내기 위해 p-값 옆에 "x"를 표시합니다.
출처 | 각 항에 대한 기대 평균 제곱 |
---|---|
(1) 첨가제 | (4) + 1.7500(3) + Q[1] |
(2) 호수 | (4) + 1.7143(3) + 5.1429(2) |
(3) 첨가제*호수 | (4) + 1.7500(3) |
(4) 오차 | (4) |
첨가제에 대한 F-통계량은 첨가제에 대한 평균 제곱을 첨가제*호수 교호작용에 대한 평균 제곱으로 나눈 값입니다. 첨가제에 대한 효과가 아주 작으면 분자의 기대값이 분모의 기대값과 같습니다. 이것이 정확한 F-검정의 예입니다.
그러나 호수 효과가 아주 작은 경우에는 분자의 기대값이 분모의 기대값과 같게 되는 평균 제곱이 없습니다. 따라서 Minitab에서는 근사 F-검정을 사용합니다. 이 예에서는 호수에 대한 평균 제곱을 첨가제*호수에 대한 평균 제곱으로 나눕니다. 그 결과 호수 효과가 아주 작은 경우 분자의 기대값이 분모의 기대값과 거의 같게 됩니다.
수정된 MS 값이 아주 작기 때문에 F-값과 p-값을 표시하기에 정밀도가 충분하지 않습니다. 해결 방법은 반응 열에 10을 곱하는 것입니다. 그런 다음 새 반응 열을 반응으로 사용하여 동일한 회귀 모형을 수행하십시오.
반응 값에 10을 곱해도 Minitab에서 출력을 표시하는 F-값과 p-값은 영향을 받지 않습니다. 그러나 나머지 출력, 특히 순차 제곱합, 수정 SS, 수정 MS, 적합치, 적합치의 표준 오차 및 잔차 열의 경우 소숫점 위치는 영향을 받습니다.
요인이 3개인 모형의 경우:
용어 | 설명 |
---|---|
![]() | 요인 A의 i번째 수준, 요인 B의 j번째 수준, 요인 C의 k번째 수준에서의 관측치에 대한 적합치 |
![]() | 요인 A의 i번째 수준, 요인 B의 j번째 수준, 요인 C의 k번째 수준에서의 관측치에 대한 평균 값 |
n | 요인 A의 i번째 수준, 요인 B의 j번째 수준, 요인 C의 k번째 수준에서의 관측치 수 |
용어 | 설명 |
---|---|
ei | i번째 잔차 |
![]() | i번째 관측된 반응 값 |
![]() | i번째 적합 반응 |