Anderson-Darling 통계량을 사용하여 분포 적합도를 평가하는 방법

Anderson-Darling(AD) 통계량은 데이터가 특정 분포를 얼마나 잘 따르는지 측정합니다. 일반적으로 분포가 데이터에 더 적합할수록 AD 통계량이 더 작습니다.

AD 통계량은 데이터에 가장 적합한 분포를 결정하는 데 도움이 되는 적합도 검정에 대한 p-값을 계산하기 위해 사용됩니다. 예를 들어, AD 통계량은 개별 분포 식별을 수행할 때 각 분포에 대해 계산됩니다. 이 통계량에서 계산된 p-값은 공정 능력 분석 또는 신뢰성 분석에 사용할 분포 모형을 결정하는 데 도움이 됩니다. AD 통계량은 또한 데이터 표본이 지정된 분포를 따르는 모집단에서 추출되었는지 여부를 검정하는 데도 사용됩니다. 예를 들어, 데이터가 t-검정의 정규성 가정을 충족하는지 여부를 검정할 수도 있습니다.

Anderson-Darling 검정의 가설은 다음과 같습니다.

H₀: 데이터가 특정 분포를 따름.
H₁: 데이터가 특정 분포를 따르지 않음.

Anderson-Darling 검정의 p-값이 선택한 유의 수준(보통 0.05 또는 0.10)보다 작으면 데이터가 특정 분포를 따르지 않는다는 결론을 내립니다. Anderson-Darling 검정의 p-값은 수학적으로 존재하지 않는 경우도 있기 때문에 Minitab이 항상 Anderson-Darling 검정의 p-값을 표시하지는 않습니다.

여러 분포의 적합도를 비교하는 경우, p-값이 가장 큰 분포가 일반적으로 데이터에 가장 가깝게 적합합니다. 분포의 p-값이 서로 유사할 경우, 실제 지식을 토대로 한 분포를 선택하십시오.

일부 명령은 수정된 Anderson-Darling 통계량 또는 AD* 통계량을 생성합니다. 수정되지 않은 Anderson-Darling 통계량은 표시점 계산에서 Kaplan-Meier 방법에 기초한 비모수 단계 함수를 사용하고, 수정된 Anderson-Darling 통계량은 표시점 계산에서 다른 방법을 사용합니다.