Anderson-Darling 통계량의 정의

Anderson-Darling 통계량은 데이터가 특정 분포를 얼마나 잘 따르는지 측정합니다. 특정 데이터 집합 및 분포에 대해 분포가 데이터에 더 적합할수록 이 통계량의 값은 더 작아집니다. 그러나 여러 분포에 대해 계산된 Anderson-Darling 통계량은 직접 비교할 수 없을 수도 있습니다. 따라서 Anderson-Darling 값의 약간의 차이는 실제적으로 관련성이 없을 수도 있습니다. 여러 분포의 적합성을 비교하려면 확률도 및 기타 정보를 사용하십시오.

수정된 Anderson-Darling 통계량의 정의

Minitab에서는 분포 ID 그림 및 신뢰도/생존 분석에 대해 수정된 Anderson-Darling 통계량을 계산합니다. 수정된 Anderson-Darling 통계량은 결과에 Anderson-Darling(수정) 또는 AD*로 표시됩니다. 일반 Anderson-Darling 통계량을 수정하면 확률도에 점을 표시하기 위해 통계량의 값이 사용되는 방법에 따라 달라집니다. 일반 Anderson-Darling 통계량은 항상 Kaplan-Meier 표시점 방법을 사용합니다.

임의 또는 다중 관측 중단된 데이터에 대해서는 수정된 Anderson-Darling 통계량에 대한 p-값을 계산할 수 없습니다. Minitab에서는 일관성을 유지하기 위해 신뢰도에 대한 p-값을 사용 가능한 경우에도 표시하지 않습니다.

참고

Minitab에서는 개별 분포 식별 분석(품질 도구)을 사용하여 수정되지 않은 Anderson-Darling 통계량을 계산합니다. 이 분석에서는 비관측 중단 데이터에 대해 항상 Kaplan-Meier 표시점 방법을 사용합니다. 수정된 Anderson-Darling 통계량을 신뢰도 분석에서 계산하는 방법에 대한 내용은 모수 분포 분석(우측 관측 중단)의 적합도 측도에 대한 방법 및 공식에서 "Anderson-Darling 통계량"을 클릭하십시오.

개별 분포 식별 및 신뢰도/생존이 다른 Anderson-Darling 통계량과 다른 이유는 무엇입니까?

그래프 > 확률도 또는 통계분석 > 품질 도구 > 개별 분포 식별에서 보고된 Anderson-Darling 통계량은 수정되지 않았습니다. 그러나 통계분석 > 신뢰성/생존 분석 메뉴의 명령에서 보고된 Anderson-Darling 통계량은 관측 중단 데이터 및 다른 표시점 방법을 처리하도록 수정되었습니다.

서로 다른 두 Anderson-Darling 통계량을 비교하려면 최대우도 추정 방법을 사용하고 표시점을 계산하기 위한 Kaplan-Meier 방법을 사용하십시오.

참고

작은 표본의 경우에는 데이터가 관측 중단되지 않았더라도 수정된 Anderson-Darling 통계량이 수정되지 않은 Anderson-Darling 통계량과 같은 결과를 생성하지 않습니다. 그러나 큰 표본 크기의 경우 두 가지 방법은 동일한 결과를 산출합니다.

Anderson-Darling 값 비교의 예

이 결과에서는 Weibull 분포의 Anderson-Darling 통계량이 6.056으로, 가장 낮습니다. 그러나 로그 정규 및 정규 분포의 경우 Anderson-Darling 통계량은 이 값에 가깝습니다.

적합도 분포 Anderson-Darling(수정) Weibull 분포 6.048 로그 정규 분포 6.165 지수 7.639 정규 분포 6.076

확률도를 조사하고 점을 연결하는 계단 함수를 생각해보면 Weibull 분포, 로그 정규 분포 및 정규 분포의 경우 단계와 적합선 사이의 영역이 비슷합니다. 지수 분포의 경우 영역이 훨씬 더 큽니다.

그러므로 이 결과에서 로그 정규 분포 및 Weibull 분포에 대한 Anderson-Darling 값에는 실제로 차이가 없습니다. 여러 분포의 백분위수 추정치가 비슷할 수 있습니다. 지수 및 Weibull Anderson-Darling 값에는 실제로 차이가 있습니다.