데이터가 각 분포를 얼마나 가깝게 따르는지 평가하려면 확률도를 사용합니다.
해당 분포가 데이터에 적합하면 점들이 적합된 분포선을 가깝게 따라야 합니다. 직선에서 벗어나 있으면 적합치가 허용되지 않는다는 것을 나타냅니다.
확률도 외에 AD p-값, LRT p-값과 같은 적합도 측도를 사용하여 분포 적합치를 평가할 수 있습니다.
Anderson-Darling 적합도 통계량(AD)은 (선택한 분포를 기반으로 한) 적합선과 (데이터 점을 기반으로 한) 비모수 단계 함수 간 편차의 측도입니다. Anderson-Darling 통계량은 분포의 끝 부분에 더 많은 가중치를 부여한 거리 제곱입니다.
Minitab에서는 Anderson-Darling 통계량을 사용하여 p-값을 계산합니다. p-값은 데이터가 분포를 따른다는 귀무 가설에 반하는 증거를 측정하는 확률입니다.
일반적으로 상당히 작은 Anderson-Darling 통계량 값은 데이터가 분포를 더 가깝게 따른다는 것을 나타냅니다. 그러나 AD 통계량은 분포에 따라 다르게 분포되므로 AD 값이 가까운 경우 여러 분포의 AD 값을 직접 비교하지 마십시오. 여러 분포의 적합치를 더 효과적으로 비교하려면 확률도, p-값, 공정 지식 등 추가 기준을 사용하십시오.
Weibull 분포를 제외한 3-모수 분포의 경우에는 AD 검정에 대한 p-값을 사용할 수 없습니다.
분포의 적합도를 평가하려면 p-값을 사용합니다.
매우 작거나 매우 큰 표본으로부터의 결과를 해석하는 경우 주의하십시오. 표본이 너무 작으면 적합도 검정이 분포에서 유의한 편차를 탐지하기 위한 검정력이 충분하지 않을 수도 있습니다. 표본이 너무 크면 검정의 검정력이 매우 커서 분포에서 실제적으로 유의하지 않은 작은 편차도 탐지할 수도 있습니다. 분포 적합도를 평가하려면 p-값 외에 확률도를 사용하십시오.
분포 | AD | P | LRT P |
---|---|---|---|
정규 분포 | 0.754 | 0.046 | |
Box-Cox 변환 | 0.414 | 0.324 | |
로그 정규 분포 | 0.650 | 0.085 | |
3-모수 로그 정규 분포 | 0.341 | * | 0.017 |
지수 | 20.614 | <0.003 | |
2-모수 지수 분포 | 1.684 | 0.014 | 0.000 |
Weibull 분포 | 1.442 | <0.010 | |
3-모수 Weibull 분포 | 0.230 | >0.500 | 0.000 |
최소극단값 분포 | 1.656 | <0.010 | |
최대 극단값 분포 | 0.394 | >0.250 | |
감마 분포 | 0.702 | 0.071 | |
3-모수 감마 분포 | 0.268 | * | 0.006 |
로지스틱 분포 | 0.726 | 0.034 | |
로그 로지스틱 분포 | 0.659 | 0.050 | |
3-모수 로지스틱 분포 | 0.432 | * | 0.027 |
Johnson 변환 | 0.124 | 0.986 |
이 결과에서는 여러 분포의 p-값이 0.05보다 큽니다. 3-모수 Weibull 분포(P > 0.500)와 최대 극단값 분포(P > 0.250)의 p-값이 가장 크고, 다른 분포보다 표본 데이터에 더 적합한 것으로 보입니다. 또한 Box-Cox 변환(P = 0.324)과 Johnson 변환(P = 0.986)이 정규 분포를 따르도록 데이터를 변환하는 데 효과적입니다.
여러 분포의 경우 Minitab에서는 추가 모수가 있는 분포에 대한 결과도 표시합니다. 예를 들어, 대수 정규 분포의 경우에는 분포의 2-모수 및 3-모수 버전 둘 다에 대한 결과를 표시합니다. 추가 모수가 있는 분포의 경우, 다른 모수를 추가할 때 분포의 적합성이 유의하게 개선되는지 확인하려면 우도 비 검정 p-값(LRT P)을 사용하십시오. 0.05보다 작은 LRT p-값은 적합성이 유의하게 개선된다는 것을 나타냅니다. 자세한 내용은 LRT P 관련 절을 참조하십시오.
여러 분포의 경우, Minitab에서는 추가 모수가 있는 분포에 대한 결과도 표시합니다. 분포의 각 추가 모수 버전에 대해 Minitab에서는 우도 비 검정에 대한 p-값(LRT P)을 보고합니다. p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. 개별 분포 식별의 우도 비 검정의 귀무 가설은 데이터가 더 작은 (더 낮은 모수) 분포를 따른다는 것입니다. 따라서 LRT p-값이 작을수록 추가 모수를 사용하면 분포 적합도가 유의하게 개선된다는 강력한 증거를 제공합니다.
LRT p-값을 사용하면 모수를 추가할 때 모수가 추가되지 않은 분포에 대해 적합도가 유의하게 개선되는지 여부를 확인할 수 있습니다.
LRT p-값은 p-값을 계산하는 표준화된 방법이 없는 3-모수 분포에도 유용합니다. 이런 경우, 먼저 해당하는 2-모수 분포의 p-값을 조사하십시오. 그런 다음 3-모수 분포에 대한 LRT p-값을 조사하여 3-모수 분포가 2-모수 분포보다 유의하게 나은지 확인합니다.
이 결과에서 3-모수 로그 정규(0.017), 3-모수 Weibull(0.000), 3-모수 감마(0.006), 3-모수 로그 로지스틱(0.027)에 대한 LRT p-값은 이들 분포가 해당하는 2-모수 분포에 비해 적합도를 유의하게 개선한다는 것을 나타냅니다.
분포 | AD | P | LRT P |
---|---|---|---|
정규 분포 | 0.754 | 0.046 | |
Box-Cox 변환 | 0.414 | 0.324 | |
로그 정규 분포 | 0.650 | 0.085 | |
3-모수 로그 정규 분포 | 0.341 | * | 0.017 |
지수 | 20.614 | <0.003 | |
2-모수 지수 분포 | 1.684 | 0.014 | 0.000 |
Weibull 분포 | 1.442 | <0.010 | |
3-모수 Weibull 분포 | 0.230 | >0.500 | 0.000 |
최소극단값 분포 | 1.656 | <0.010 | |
최대 극단값 분포 | 0.394 | >0.250 | |
감마 분포 | 0.702 | 0.071 | |
3-모수 감마 분포 | 0.268 | * | 0.006 |
로지스틱 분포 | 0.726 | 0.034 | |
로그 로지스틱 분포 | 0.659 | 0.050 | |
3-모수 로지스틱 분포 | 0.432 | * | 0.027 |
Johnson 변환 | 0.124 | 0.986 |