개별 분포 식별에 대한 적합도

개별 분포 식별과 함께 제공되는 모든 적합도 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

확률도

확률도에는 표본의 각 데이터 점 및 해당 데이터 점보다 작거나 같은 값의 백분율이 표시됩니다.
이 그림은 다음과 같은 성분으로 구성됩니다.
중간 선
모수 추정치의 최대우도에 바탕을 둔 분포에서 예상되는 백분위수입니다.
신뢰 한계 선
왼쪽 곡선은 백분위수에 대한 신뢰 구간의 하한을 연결한 것입니다. 오른쪽 곡선은 백분위수에 대한 신뢰 구간의 상한을 연결한 것입니다.

해석

데이터가 각 분포를 얼마나 가깝게 따르는지 평가하려면 확률도를 사용합니다.

해당 분포가 데이터에 적합하면 점들이 적합된 분포선을 가깝게 따라야 합니다. 직선에서 벗어나 있으면 적합치가 허용되지 않는다는 것을 나타냅니다.

좋은 적합치
좋지 않은 적합치

확률도 외에 AD p-값, LRT p-값과 같은 적합도 측도를 사용하여 분포 적합치를 평가할 수 있습니다.

데이터를 모형화하기 위해 분포를 선택할 때 공정 지식도 활용하십시오. 여러 분포가 데이터를 잘 적합시키는 경우에는 다음 전략을 사용하여 분포를 선택하십시오.
  • 해당 업종이나 분야에서 가장 일반적으로 사용되는 분포를 선택합니다.
  • 가장 보수적인 결과를 제공하는 분포를 선택합니다. 예를 들어, 공정 능력 분석을 수행하는 경우 여러 분포를 사용하여 분석을 수행한 다음 가장 보수적인 공정 능력 지수를 산출하는 분포를 선택할 수 있습니다. 자세한 내용을 보려면 개별 분포 식별에 대한 분포 백분위수에서 "백분율 및 백분위수"를 클릭하십시오.
  • 데이터를 잘 적합시키는 가장 간단한 분포를 선택합니다. 예를 들어, 2-모수 및 3-모수 분포 모두 데이터를 잘 적합시키는 경우 더 간단한 2-모수 분포를 선택할 수 있습니다.

P

각 분포에 대해 Minitab에서는 Anderson-Darling(AD) 검정에 대한 p-값(P)을 보고합니다. p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. AD 검정의 귀무 가설은 데이터가 분포를 따른다는 것입니다. 따라서 p-값이 작을수록 데이터가 분포를 따르지 않는다는 더 강력한 증거를 제공합니다.
참고

Weibull 분포를 제외한 3-모수 분포의 경우에는 AD 검정에 대한 p-값을 사용할 수 없습니다.

해석

분포의 적합도를 평가하려면 p-값을 사용합니다.

각 분포 또는 변환에 대한 p-값을 유의 수준과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 데이터가 분포를 따르지만 분포를 따르지 않는다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 데이터가 분포를 따르지 않음(H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각하고 데이터가 분포를 따르지 않는다는 결론을 내립니다.
p-값 > α: 데이터가 분포를 따르지 않는다는 결론을 내릴 수 없음(H0 기각 실패)
p-값이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 데이터가 분포를 따르지 않는다는 결론을 내릴 만한 충분한 증거가 없습니다. 데이터가 분포를 따른다고 가정할 수 있습니다.
데이터를 모형화하기 위해 분포를 선택할 때 공정 지식도 활용하십시오. 여러 분포가 데이터를 잘 적합시키는 경우에는 다음 전략을 사용하여 분포를 선택하십시오.
  • 해당 업종이나 분야에서 가장 일반적으로 사용되는 분포를 선택합니다.
  • 가장 보수적인 결과를 제공하는 분포를 선택합니다. 예를 들어, 공정 능력 분석을 수행하는 경우 여러 분포를 사용하여 분석을 수행한 다음 가장 보수적인 공정 능력 지수를 산출하는 분포를 선택할 수 있습니다. 자세한 내용은 개별 분포 식별에 대한 분포 백분위수에서 "백분율 및 백분위수"를 클릭하십시오.
  • 데이터를 잘 적합시키는 가장 간단한 분포를 선택합니다. 예를 들어, 2-모수 및 3-모수 분포 모두 데이터를 잘 적합시키는 경우 더 간단한 2-모수 분포를 선택할 수 있습니다.
중요

매우 작거나 매우 큰 표본으로부터의 결과를 해석하는 경우 주의하십시오. 표본이 너무 작으면 적합도 검정이 분포에서 유의한 편차를 탐지하기 위한 검정력이 충분하지 않을 수도 있습니다. 표본이 너무 크면 검정의 검정력이 매우 커서 분포에서 실제적으로 유의하지 않은 작은 편차도 탐지할 수도 있습니다. 분포 적합도를 평가하려면 p-값 외에 확률도를 사용하십시오.

적합도 검정

분포ADPLRT P
정규 분포0.7540.046 
Box-Cox 변환0.4140.324 
로그 정규 분포0.6500.085 
3-모수 로그 정규 분포0.341*0.017
지수20.614<0.003 
2-모수 지수 분포1.6840.0140.000
Weibull 분포1.442<0.010 
3-모수 Weibull 분포0.230>0.5000.000
최소극단값 분포1.656<0.010 
최대 극단값 분포0.394>0.250 
감마 분포0.7020.071 
3-모수 감마 분포0.268*0.006
로지스틱 분포0.7260.034 
로그 로지스틱 분포0.6590.050 
3-모수 로지스틱 분포0.432*0.027
Johnson 변환0.1240.986 

이 결과에서는 여러 분포의 p-값이 0.05보다 큽니다. 3-모수 Weibull 분포(P > 0.500)와 최대 극단값 분포(P > 0.250)의 p-값이 가장 크고, 다른 분포보다 표본 데이터에 더 적합한 것으로 보입니다. 또한 Box-Cox 변환(P = 0.324)과 Johnson 변환(P = 0.986)이 정규 분포를 따르도록 데이터를 변환하는 데 효과적입니다.

참고

여러 분포의 경우 Minitab에서는 추가 모수가 있는 분포에 대한 결과도 표시합니다. 예를 들어, 대수 정규 분포의 경우에는 분포의 2-모수 및 3-모수 버전 둘 다에 대한 결과를 표시합니다. 추가 모수가 있는 분포의 경우, 다른 모수를 추가할 때 분포의 적합성이 유의하게 개선되는지 확인하려면 우도 비 검정 p-값(LRT P)을 사용하십시오. 0.05보다 작은 LRT p-값은 적합성이 유의하게 개선된다는 것을 나타냅니다. 자세한 내용은 LRT P 관련 절을 참조하십시오.

LRT P

여러 분포의 경우, Minitab에서는 추가 모수가 있는 분포에 대한 결과도 표시합니다. 분포의 각 추가 모수 버전에 대해 Minitab에서는 우도 비 검정에 대한 p-값(LRT P)을 보고합니다. p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. 개별 분포 식별의 우도 비 검정의 귀무 가설은 데이터가 더 작은 (더 낮은 모수) 분포를 따른다는 것입니다. 따라서 LRT p-값이 작을수록 추가 모수를 사용하면 분포 적합도가 유의하게 개선된다는 강력한 증거를 제공합니다.

해석

LRT p-값을 사용하면 모수를 추가할 때 모수가 추가되지 않은 분포에 대해 적합도가 유의하게 개선되는지 여부를 확인할 수 있습니다.

각 분포 또는 변환에 대해 LRT p-값을 유의 수준과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 추가 모수가 실제로 분포를 유의하게 개선하지 않지만 개선한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
P ≤ α: 더 큰 (더 높은 모수) 분포가 유의하게 더 나은 적합도를 제공합니다. (H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각하고 추가 모수를 사용하면 분포 적합도가 유의하게 개선된다는 결론을 내립니다.
P > α: 더 큰 (더 높은 모수) 분포가 유의하게 더 나은 적합도를 제공한다는 결론을 내릴 수 없습니다. (H0기각 실패)
p-값이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 추가 모수를 사용하면 분포 적합도가 유의하게 개선된다는 결론을 내릴 만한 충분한 증거가 없습니다.

LRT p-값은 p-값을 계산하는 표준화된 방법이 없는 3-모수 분포에도 유용합니다. 이런 경우, 먼저 해당하는 2-모수 분포의 p-값을 조사하십시오. 그런 다음 3-모수 분포에 대한 LRT p-값을 조사하여 3-모수 분포가 2-모수 분포보다 유의하게 나은지 확인합니다.

이 결과에서 3-모수 로그 정규(0.017), 3-모수 Weibull(0.000), 3-모수 감마(0.006), 3-모수 로그 로지스틱(0.027)에 대한 LRT p-값은 이들 분포가 해당하는 2-모수 분포에 비해 적합도를 유의하게 개선한다는 것을 나타냅니다.

적합도 검정

분포ADPLRT P
정규 분포0.7540.046 
Box-Cox 변환0.4140.324 
로그 정규 분포0.6500.085 
3-모수 로그 정규 분포0.341*0.017
지수20.614<0.003 
2-모수 지수 분포1.6840.0140.000
Weibull 분포1.442<0.010 
3-모수 Weibull 분포0.230>0.5000.000
최소극단값 분포1.656<0.010 
최대 극단값 분포0.394>0.250 
감마 분포0.7020.071 
3-모수 감마 분포0.268*0.006
로지스틱 분포0.7260.034 
로그 로지스틱 분포0.6590.050 
3-모수 로지스틱 분포0.432*0.027
Johnson 변환0.1240.986