등분산 검정 정의

등분산 검정을 사용하여 모집단 또는 요인 수준 간 분산의 동일성을 검정할 수 있습니다. 분산 분석과 회귀 분석 등 대부분의 통계 절차에서는 표본들이 서로 다른 평균을 갖는 모집단에서 추출되었더라도 분산이 동일하다고 가정합니다.

동일하지 않은 분산에 대한 민감도가 절차에 따라 크게 다르기 때문에 등분산 검정을 수행해야 하는 필요성도 절차에 따라 크게 다릅니다. 예를 들어, 모형에 고정 요인만 포함되어 있고 표본 크기가 같거나 유사할 경우 분산의 비동일성이 분산 분석 추론에 미치는 영향은 아주 작습니다. 반면에, 분산 분석 모형에 랜덤 효과가 포함되어 있고 표본 크기가 같지 않은 경우 상당한 영향을 받을 수 있습니다.

예를 들어, 통화자의 대기 시간에 대해 분산 분석 검정을 수행한다고 가정합니다. 여기서 주 고정 요인은 콜 센터입니다. 표본 크기가 같지 않기 때문에 일반 선형 모형(GLM) 분산 분석을 사용합니다. 이렇게 불균형적인 조건에 따라 동일하지 않은 분산에 대한 민감도가 증가하기 때문에, 등분산 가정에 대한 검정을 수행합니다. 검정 결과 p-값이 적절하게 선택된 알파 값보다 크면 분산이 동일하다는 귀무 가설을 기각할 수 없습니다. 등분산 가정이 충족된다는 것을 확인할 수 있습니다.

등분산 검정에 대한 가설은 다음과 같습니다.
  • H0: 모든 분산이 동일함
  • H1: 모든 분산이 동일하지 않음

어느 검정을 기반으로 결론을 내려야 합니까?

기본적으로 Minitab의 등분산 검정 명령은 Levene의 방법 및 다중 비교 검정에 대한 결과를 표시합니다. 대부분 계량형 분산의 경우 두 가지 방법 모두 지정된 유의 수준(알파 또는 α라고도 함)에 가까운 제1종 오류율을 제공합니다. 일반적으로 다중 비교 구간이 더 강력합니다. 다중 비교 방법에 대한 p-값이 유의한 경우 요약도를 사용하여 서로 다른 표준 편차를 가진 특정 모집단을 식별할 수 있습니다. 다음 사항이 참이 아닌 경우 다중 비교 방법에 대한 결과를 기반으로 결론을 내려야 합니다.
  • 각 표본의 관측치가 20개 미만입니다.
  • 하나 이상의 모집단에 대한 분포가 심하게 치우쳐 있거나 두꺼운 꼬리를 가지는 모집단이 있습니다. 두꺼운 꼬리를 가진 분포는 정규 분포와 비교하여 하한과 상한에 데이터가 더 많이 있습니다.

심하게 치우쳐 있거나 꼬리가 두꺼운 분포에서 추출한 작은 분포의 경우 다중 비교 방법에 대한 제1종 오류율이 α보다 높을 수 있습니다. 이러한 조건에서 Levene의 방법이 다중 비교 방법보다 작은 p-값을 제공하는 경우 Levene의 방법을 기반으로 결론을 내려야 합니다. 그렇지 않은 경우 다중 비교 방법을 기반으로 결론을 내릴 수 있지만, 제1종 오류율이 α보다 클 가능성이 있습니다.

F-검정 및 Barltett의 검정

다중 비교 방법 및 Levene의 방법 대신 정규 분포를 바탕으로 한 검정 결과를 표시하도록 선택할 수 있습니다. 그룹 또는 요인 수준이 2개만 있는 경우 Minitab에서는 F-검정을 수행합니다. 그룹 또는 요인 수준이 3개 이상인 경우 Minitab에서는 Bartlett의 검정을 수행합니다.

F-검정과 Bartlett의 검정은 정규 분포 데이터에 대해서만 정확합니다. 정규성에서 벗어날 경우 검정 결과가 부정확해질 수 있습니다. 그러나 데이터가 정규 분포를 따르는 경우 일반적으로 F-검정 및 Bartlett의 검정이 다중 비교 방법이나 Levene의 방법보다 강력합니다.