균형 분산 분석에 대한 방법 및 공식

원하는 방법 또는 공식을 선택하십시오.

균형 분산 분석 모형

세 개 이상의 요인에 대한 균형 분산 분석 모형은 이원 분산 분석 모형을 간단히 확장한 것입니다.

요인 A, B, C가 포함된 3-요인 균형 분산 분석 모형은 다음과 같습니다.

yijkm = μ + α i+ β j + γ k + (αβ)ij+ (αγ)ik+ (βγ)jk+ (αβγ)ijkijkm

요인이 고정 요인인 경우 Σαi = 0, Σβj = 0, Σγk = 0, Σ(αβ)ij = 0, Σ(αγ)ik = 0, Σ(βγ)jk = 0, Σ(αβγ)ijk = 0이고 εijkm는 독립 N(0, σ2)입니다.

요인이 변량 요인인 경우 α i, β j , γk, (αβ)ij, (αγ)ik, (βγ)jk, (αβγ)ijk이고 εijkm은 독립 랜덤 변수입니다. 변수들은 평균이 0이고 분산이 V(αi) = σ2α,V(β j) = σ2β,V(γk) = σ2γ, V[(αβ)ij] = σ2αβ, V[(αγ)jk] = σ2αγ, V[(βγ)jk] = σ2βγ, V(εijkm) = σ2인 정규 분포를 따릅니다.

요인이 세 개인 모형은 요인이 네 개 이상인 모형으로 확장할 수 있습니다.

요인 평균

공식

지정된 수준에서 요인에 대한 관측치의 평균입니다. 공식은 다음과 같습니다.

요인 A의 평균:

요인 B의 평균:

요인 C의 평균:

전체 평균:

표기법

용어설명
yi...A의 i번째 요인 수준에 대한 모든 관측치의 합
y.j..B의 j번째 요인 수준에 대한 모든 관측치의 합
y..k.C의 k번째 요인 수준에 대한 모든 관측치의 합
y....표본 내 모든 관측치의 합
aA의 수준 수
bB의 수준 수
cC의 수준 수
n요인과 수준의 각 조합에서의 관측치 수

제곱합(SS)

거리 제곱의 합입니다. SS 전체는 데이터의 총 변동입니다. SS (A), SS (B), SS (C)는 추정된 요인 수준 평균의 전체 평균으로부터의 변동량을 나타냅니다. 처리 간 제곱합이라고도 합니다. SS(AB), SS(AC), SS(BC) 및 SS(ABC)는 각 교호작용 항이 설명하는 변동량을 나타냅니다. SS 오차는 적합치와 실제 관측치 간의 변동량을 나타냅니다. 처리 내 오차라고도 합니다. 이 공식에서는 완전 모형이 적합하다고 가정합니다. 다음과 같이 계산됩니다.

  • SS 오차 = SS 전체 - SS (모형의 모든 항)

표기법

용어설명
a요인 A의 수준 수
b요인 B의 수준 수
c요인 C의 수준 수
n총 시행 횟수
요인 A의 i번째 요인 수준의 평균
모든 관측치의 전체 평균
요인 B의 j번째 요인 수준의 평균
요인 C의 k번째 요인 수준의 평균
추정된 처리 평균

자유도(DF)

모형의 각 성분에 대한 자유도는 다음과 같습니다.

변동 원인 DF
요인 ki – 1
공변량 및 공변량 간의 교호작용 1
요인이 포함된 교호작용
회귀 분석 p
오차 n p – 1
합계 n – 1

표기법

용어설명
kii번째 요인의 수준 수
m요인 수
n관측치 수
p상수를 제외한 모형 내 계수의 수

평균 제곱(MS)

공식

F

요인이 모두 고정 요인인 3-요인 분산 분석의 경우 완전 모형의 F-통계량에 대한 공식은 다음과 같습니다.

공식

  • F(A)의 경우, 분자의 자유도는 a - 1이고 분모의 자유도는 (n - 1)abc입니다.
  • F(B)의 경우, 분자의 자유도는 b - 1이고 분모의 자유도는 (n - 1)abc입니다.
  • F(C)의 경우, 분자의 자유도는 c - 1이고 분모의 자유도는 (n - 1)abc입니다.
  • F(AB)의 경우, 분자의 자유도는 (a - 1)(b - 1)이고 분모의 자유도는 (n - 1)abc입니다.
  • F(AC)의 경우, 분자의 자유도는 (a - 1)(c - 1)이고 분모의 자유도는 (n - 1)abc입니다.
  • F(BC)의 경우, 분자의 자유도는 (b - 1)(c - 1)이고 분모의 자유도는 (n - 1)abc입니다.
  • F(ABC)의 경우, 분자의 자유도는 (a - 1)(b - 1)(c - 1)이고 분모의 자유도는 (n - 1)abc입니다.

모형에 변량 요인이 있는 경우 각 항에 대한 F 비율은 각 항에 대한 기대 평균 제곱에 의해 결정됩니다.

F 값이 더 크면 귀무 가설을 기각하게 됩니다. 효과가 통계적으로 유의하다는 결론을 내릴 수 있습니다.

p-값 – 분산 분석표

p-값은 자유도(DF)가 다음과 같은 F 분포에서 계산되는 확률입니다.

분자 DF
검정의 항에 대한 자유도의 합
분모 DF
오차에 대한 자유도

공식

1 − P(Ffj)

표기법

용어설명
P(Ff)F-분포의 누적분포함수
f검정에 대한 f-통계량

S

표기법

용어설명
MSE평균 제곱 오차

R-제곱

R2은 결정 계수라고도 합니다.

공식

표기법

용어설명
yi i번째 관측된 반응 값
평균 반응
i번째 적합 반응

R-제곱(수정)

계산 결과 수정된 R2 값이 음수가 될 수 있지만, Minitab에서는 이 경우 0을 표시합니다.

표기법

용어설명
i번째 관측된 반응 값
i번째 적합 반응
평균 반응
n관측치 수
p모형의 항 수

분산 성분

Minitab은 변량 요인에 대해서만 분산 성분을 계산합니다. 두 개의 변량 요인이 있는 모형은 공식을 나타내기 위해 사용됩니다.

여기서 αi, βj , (αβ)ij, εijk는 독립적인 랜덤 변수입니다. 이 변수들은 평균이 0이고 분산이 아래 공식으로 지정되는 정규 분포를 따릅니다.

이러한 분산이 분산 성분입니다. 이 경우 분산 성분이 0이라는 가설을 검정하십시오.

요인이 두 개인 제한된 혼합 모형의 경우 모형은 다음과 같습니다.

여기서 αi는 고정 효과, βj는 랜덤 효과, (αβ)ij는 랜덤 효과, εijk는 랜덤 오차입니다. 각 j에 대해 Σα i = 0이고 Σ(αβ)ij = 0입니다. 분산은 V(βj) = σ2β,V[(αβ)ij] =[(a - 1)/a]σ2αβ 및 V(εijk) = σ2입니다. σ2β, σ2αβ 및 σ2는 분산 성분입니다. 고정 요인에 대한 교호작용 성분을 합하면 0으로, 이 모형이 제한된 혼합 모형이라는 것을 나타냅니다.

고정 요인 A, 변량 요인 B가 포함된 제한되지 않는 혼합 모형의 경우 다음 공식이 모형을 설명합니다.

여기서 αi는 고정 효과이고 βj, (αβ)ijεijk는 평균이 0이고 분산이 다음과 같은 상관 관계가 없는 랜덤 변수입니다.

이러한 분산이 분산 성분입니다. 각 j에 대해 Σα i = 0이고 Σ(αβ)ij = 0입니다.

이 정보는 균형 모형에 대한 것입니다. 불균형적이거나 더 복잡한 모형에 대한 정보는 Montgomery1 및 Neter2를 참조하십시오.

  1. D.C. Montgomery (1991). Design and Analysis of Experiments, Third Edition. John Wiley & Sons.
  2. J. Neter, W. Wasserman and M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

기대 평균 제곱

두 요인 A, B가 포함된 랜덤 효과 모형의 기대 평균 제곱에 대한 공식은 다음과 같습니다.

두 요인 A(고정), B(변량)가 포함된 제한된 혼합 모형의 기대 평균 제곱에 대한 공식은 다음과 같습니다.

고정 요인 A, 변량 요인 B가 포함된 제한되지 않는 혼합 모형의 기대 평균 제곱에 대한 공식은 다음과 같습니다.

기대 평균 제곱 계산에 대한 일반 규칙 및 불균형적이거나 더 복잡한 모형에 대한 정보는 Montgomery1 및 Neter2를 참조하십시오.

  1. D.C. Montgomery (1991). Design and Analysis of Experiments, Third Edition. John Wiley & Sons.
  2. J. Neter, W. Wasserman and M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

표기법

용어설명
b요인 B의 수준 수
a요인 A의 수준 수
n관측치 수
σ2모형의 추정 분산
A의 추정 분산
B의 추정 분산
AB의 추정 분산
A의 고정 효과

변량 요인이 포함된 모형에 대한 F-통계량

분산 분석 결과에서 F-통계량이 계산되는 방법

각 F-통계량은 평균 제곱의 비율입니다. 분자는 항에 대한 평균 제곱입니다. 분모는 분자 평균 제곱의 기대값이 분모 평균 제곱의 기대값과 중요한 효과만큼만 다르도록 선택됩니다. 랜덤 항에 대한 효과는 항의 분산 성분으로 표시됩니다. 고정된 항의 효과는 해당 항과 연관된 모형 성분의 제곱합을 자유도로 나눈 값으로 표시됩니다. 따라서 높은 F-통계량은 유의한 효과를 나타냅니다.

모형의 모든 항이 고정되어 있는 경우 각 F-통계량의 분모는 잔차의 평균 제곱(MSE)입니다. 그러나 랜덤 항을 포함하는 모형의 경우 MSE는 올바른 오차항이 아닐 수도 있습니다. 기대 평균 제곱(EMS)은 어느 항이 분모로 적절한지 확인하기 위해 사용할 수 있습니다.

화면 고정 요인과 기술 변량 요인을 사용하여 분산 분석을 수행하고, 다음과 같은 EMS 결과를 얻었다고 가정합니다.
출처 각 항에 대한 기대 평균 제곱
(1) 화면 (4) + 2.0000(3) + Q[1]
(2) 기술 (4) + 2.0000(3) + 4.0000(2)
(3) 화면*기술 (4) + 2.0000(3)
(4) 오차 (4)

괄호 안의 숫자는 출처 번호 옆에 나열된 항과 연관된 랜덤 효과를 나타냅니다. (2)는 '기술'의 랜덤 효과, (3)은 화면*기술 교호작용의 랜덤 효과, (4)는 '오차'의 랜덤 효과를 나타냅니다. '오차'에 대한 EMS는 오차항의 효과입니다. 또한 화면*기술에 대한 EMS는 오차항의 효과에 화면*기술 교호작용 효과의 두 배를 더한 것입니다.

화면*기술에 대한 F-통계량을 계산하기 위해 분자의 기대값(화면*기술에 대한 EMS = (4) + 2.0000(3))이 분모의 기대값(오차에 대한 EMS = (4))과 교호작용의 효과(2.0000(3))만큼만 다르도록 화면*기술에 대한 평균 제곱을 오차의 평균 제곱으로 나눕니다. 따라서 높은 F-통계량은 유의한 화면*기술 교호작용을 나타냅니다.

Q[ ] 안의 숫자는 출처 번호 옆에 나열된 항과 연관된 고정 효과를 나타냅니다. 예를 들어, Q[1]은 화면의 고정 효과입니다. 화면에 대한 EMS는 오차항 효과에 화면*기술 교호작용 효과의 두 배, 화면 효과의 상수 배를 더한 것입니다. Q[1]은 (b*n * sum((화면 수준에 대한 계수)**2))를 (a - 1)로 나눈 값입니다. 여기서 a와 b는 각각 화면과 기술의 수준 수이며 n은 반복실험의 수입니다.

화면에 대한 F-통계량을 계산하기 위해 분자의 기대값(화면에 대한 EMS = (4) + 2.0000(3) + Q[1])이 분모의 기대값(화면*기술에 대한 EMS = (4) + 2003(3))과 화면(Q[1])으로 인한 효과만큼만 다르도록 화면에 대한 평균 제곱을 화면*기술에 대한 평균 제곱으로 나눕니다. 따라서 높은 F-통계량은 유의한 화면 효과를 나타냅니다.

분산 분석 출력에서 분산 분석표의 p-값 옆에 "x" 및 "정확한 F-검정이 아님" 레이블이 표시되는 이유

항에 대한 정확한 F-검정은 분자 평균 제곱의 기대값이 분모 평균 제곱의 기대값과 분산 성분 또는 중요한 고정 요인만큼만 다른 검정입니다.

그러나 경우에 따라 이러한 평균 제곱을 계산할 수 없습니다. 이 경우 Minitab에서는 근사 F-검정을 생성하는 평균 제곱을 사용하고 F-검정이 정확하지 않다는 것을 나타내기 위해 p-값 옆에 "x"를 표시합니다.

예를 들어, 첨가제 고정 요인과 호수 변량 요인을 사용하여 분산 분석을 수행하고, 다음과 같은 기대 평균 제곱(EMS) 출력을 얻었다고 가정합니다.
출처 각 항에 대한 기대 평균 제곱
(1) 첨가제 (4) + 1.7500(3) + Q[1]
(2) 호수 (4) + 1.7143(3) + 5.1429(2)
(3) 첨가제*호수 (4) + 1.7500(3)
(4) 오차 (4)

첨가제에 대한 F-통계량은 첨가제에 대한 평균 제곱을 첨가제*호수 교호작용에 대한 평균 제곱으로 나눈 값입니다. 첨가제에 대한 효과가 아주 작으면 분자의 기대값이 분모의 기대값과 같습니다. 이것이 정확한 F-검정의 예입니다.

그러나 호수 효과가 아주 작은 경우에는 분자의 기대값이 분모의 기대값과 같게 되는 평균 제곱이 없습니다. 따라서 Minitab에서는 근사 F-검정을 사용합니다. 이 예에서는 호수에 대한 평균 제곱을 첨가제*호수에 대한 평균 제곱으로 나눕니다. 그 결과 호수 효과가 아주 작은 경우 분자의 기대값이 분모의 기대값과 거의 같게 됩니다.

"F-검정의 분모가 0이거나 정의되지 않았습니다" 메시지에 대한 정보.

Minitab에서는 다음 이유 중 하나로 F-검정의 분모가 0인 경우 오류를 표시합니다.
  • 오차에 대한 자유도가 1 이상이 아닙니다.
  • 수정된 MS 값이 아주 작기 때문에 F-값과 p-값을 표시하기에 정밀도가 충분하지 않습니다. 해결 방법은 반응 열에 10을 곱하는 것입니다. 그런 다음 새 반응 열을 반응으로 사용하여 동일한 회귀 모형을 수행하십시오.

    참고

    반응 값에 10을 곱해도 Minitab에서 출력을 표시하는 F-값과 p-값은 영향을 받지 않습니다. 그러나 나머지 출력, 특히 순차 제곱합, 수정 SS, 수정 MS, 적합치, 적합치의 표준 오차 및 잔차 열의 경우 소숫점 위치는 영향을 받습니다.

분산 분석 결과에서 F-통계량이 계산되는 방법

각 F-통계량은 평균 제곱의 비율입니다. 분자는 항에 대한 평균 제곱입니다. 분모는 분자 평균 제곱의 기대값이 분모 평균 제곱의 기대값과 중요한 효과만큼만 다르도록 선택됩니다. 랜덤 항에 대한 효과는 항의 분산 성분으로 표시됩니다. 고정된 항의 효과는 해당 항과 연관된 모형 성분의 제곱합을 자유도로 나눈 값으로 표시됩니다. 따라서 높은 F-통계량은 유의한 효과를 나타냅니다.

모형의 모든 항이 고정되어 있는 경우 각 F-통계량의 분모는 잔차의 평균 제곱(MSE)입니다. 그러나 랜덤 항을 포함하는 모형의 경우 MSE는 올바른 오차항이 아닐 수도 있습니다. 기대 평균 제곱(EMS)은 어느 항이 분모로 적절한지 확인하기 위해 사용할 수 있습니다.

화면 고정 요인과 기술 변량 요인을 사용하여 분산 분석을 수행하고, 다음과 같은 EMS 결과를 얻었다고 가정합니다.
출처 각 항에 대한 기대 평균 제곱
(1) 화면 (4) + 2.0000(3) + Q[1]
(2) 기술 (4) + 2.0000(3) + 4.0000(2)
(3) 화면*기술 (4) + 2.0000(3)
(4) 오차 (4)

괄호 안의 숫자는 출처 번호 옆에 나열된 항과 연관된 랜덤 효과를 나타냅니다. (2)는 '기술'의 랜덤 효과, (3)은 화면*기술 교호작용의 랜덤 효과, (4)는 '오차'의 랜덤 효과를 나타냅니다. '오차'에 대한 EMS는 오차항의 효과입니다. 또한 화면*기술에 대한 EMS는 오차항의 효과에 화면*기술 교호작용 효과의 두 배를 더한 것입니다.

화면*기술에 대한 F-통계량을 계산하기 위해 분자의 기대값(화면*기술에 대한 EMS = (4) + 2.0000(3))이 분모의 기대값(오차에 대한 EMS = (4))과 교호작용의 효과(2.0000(3))만큼만 다르도록 화면*기술에 대한 평균 제곱을 오차의 평균 제곱으로 나눕니다. 따라서 높은 F-통계량은 유의한 화면*기술 교호작용을 나타냅니다.

Q[ ] 안의 숫자는 출처 번호 옆에 나열된 항과 연관된 고정 효과를 나타냅니다. 예를 들어, Q[1]은 화면의 고정 효과입니다. 화면에 대한 EMS는 오차항 효과에 화면*기술 교호작용 효과의 두 배, 화면 효과의 상수 배를 더한 것입니다. Q[1]은 (b*n * sum((화면 수준에 대한 계수)**2))를 (a - 1)로 나눈 값입니다. 여기서 a와 b는 각각 화면과 기술의 수준 수이며 n은 반복실험의 수입니다.

화면에 대한 F-통계량을 계산하기 위해 분자의 기대값(화면에 대한 EMS = (4) + 2.0000(3) + Q[1])이 분모의 기대값(화면*기술에 대한 EMS = (4) + 2003(3))과 화면(Q[1])으로 인한 효과만큼만 다르도록 화면에 대한 평균 제곱을 화면*기술에 대한 평균 제곱으로 나눕니다. 따라서 높은 F-통계량은 유의한 화면 효과를 나타냅니다.

분산 분석 출력에서 분산 분석표의 p-값 옆에 "x" 및 "정확한 F-검정이 아님" 레이블이 표시되는 이유

항에 대한 정확한 F-검정은 분자 평균 제곱의 기대값이 분모 평균 제곱의 기대값과 분산 성분 또는 중요한 고정 요인만큼만 다른 검정입니다.

그러나 경우에 따라 이러한 평균 제곱을 계산할 수 없습니다. 이 경우 Minitab에서는 근사 F-검정을 생성하는 평균 제곱을 사용하고 F-검정이 정확하지 않다는 것을 나타내기 위해 p-값 옆에 "x"를 표시합니다.

예를 들어, 첨가제 고정 요인과 호수 변량 요인을 사용하여 분산 분석을 수행하고, 다음과 같은 기대 평균 제곱(EMS) 출력을 얻었다고 가정합니다.
출처 각 항에 대한 기대 평균 제곱
(1) 첨가제 (4) + 1.7500(3) + Q[1]
(2) 호수 (4) + 1.7143(3) + 5.1429(2)
(3) 첨가제*호수 (4) + 1.7500(3)
(4) 오차 (4)

첨가제에 대한 F-통계량은 첨가제에 대한 평균 제곱을 첨가제*호수 교호작용에 대한 평균 제곱으로 나눈 값입니다. 첨가제에 대한 효과가 아주 작으면 분자의 기대값이 분모의 기대값과 같습니다. 이것이 정확한 F-검정의 예입니다.

그러나 호수 효과가 아주 작은 경우에는 분자의 기대값이 분모의 기대값과 같게 되는 평균 제곱이 없습니다. 따라서 Minitab에서는 근사 F-검정을 사용합니다. 이 예에서는 호수에 대한 평균 제곱을 첨가제*호수에 대한 평균 제곱으로 나눕니다. 그 결과 호수 효과가 아주 작은 경우 분자의 기대값이 분모의 기대값과 거의 같게 됩니다.

"F-검정의 분모가 0이거나 정의되지 않았습니다" 메시지에 대한 정보.

Minitab에서는 다음 이유 중 하나로 F-검정의 분모가 0인 경우 오류를 표시합니다.
  • 오차에 대한 자유도가 1 이상이 아닙니다.
  • 수정된 MS 값이 아주 작기 때문에 F-값과 p-값을 표시하기에 정밀도가 충분하지 않습니다. 해결 방법은 반응 열에 10을 곱하는 것입니다. 그런 다음 새 반응 열을 반응으로 사용하여 동일한 회귀 모형을 수행하십시오.

    참고

    반응 값에 10을 곱해도 Minitab에서 출력을 표시하는 F-값과 p-값은 영향을 받지 않습니다. 그러나 나머지 출력, 특히 순차 제곱합, 수정 SS, 수정 MS, 적합치, 적합치의 표준 오차 및 잔차 열의 경우 소숫점 위치는 영향을 받습니다.

적합치

표기법

요인이 3개인 모형의 경우:

용어설명
요인 A의 i번째 수준, 요인 B의 j번째 수준, 요인 C의 k번째 수준에서의 관측치에 대한 적합치
요인 A의 i번째 수준, 요인 B의 j번째 수준, 요인 C의 k번째 수준에서의 관측치에 대한 평균 값
n요인 A의 i번째 수준, 요인 B의 j번째 수준, 요인 C의 k번째 수준에서의 관측치 수

잔차

표기법

용어설명
ei i번째 잔차
i번째 관측된 반응 값
i번째 적합 반응