해당 분포가 데이터에 적합하면 점들이 적합된 분포선을 가깝게 따라야 합니다. 직선에서 벗어나 있으면 적합치가 허용되지 않는다는 것을 나타냅니다.
좋은 적합치
좋지 않은 적합치
분포 적합치를 평가하려면 적합도 외에 p-값, 실제 공정 지식과 같은 적합도 측도를 사용하십시오.
2단계: 분포의 적합도 평가
분포의 적합도를 평가하려면 p-값을 사용합니다.
각 분포 또는 변환에 대한 p-값을 유의 수준과 비교합니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 데이터가 분포를 따르지만 분포를 따르지 않는다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 데이터가 분포를 따르지 않음(H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각하고 데이터가 분포를 따르지 않는다는 결론을 내립니다.
p-값 > α: 데이터가 분포를 따르지 않는다는 결론을 내릴 수 없음(H0 기각 실패)
p-값이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 데이터가 분포를 따르지 않는다는 결론을 내릴 만한 충분한 증거가 없습니다. 데이터가 분포를 따른다고 가정할 수 있습니다.
데이터를 모형화하기 위해 분포를 선택할 때 공정 지식도 활용합니다. 여러 분포가 데이터를 잘 적합시키는 경우에는 다음 전략을 사용하여 분포를 선택합니다.
해당 업종이나 분야에서 가장 일반적으로 사용되는 분포를 선택합니다.
가장 보수적인 결과를 제공하는 분포를 선택합니다. 예를 들어, 공정 능력 분석을 수행하는 경우 여러 분포를 사용하여 분석을 수행한 다음 가장 보수적인 공정 능력 지수를 산출하는 분포를 선택할 수 있습니다. 자세한 내용을 보려면 개별 분포 식별에 대한 분포 백분위수에서 "백분율 및 백분위수"를 클릭하십시오.
데이터를 잘 적합시키는 가장 간단한 분포를 선택합니다. 예를 들어, 2-모수 및 3-모수 분포 모두 데이터를 잘 적합시키는 경우 더 간단한 2-모수 분포를 선택할 수 있습니다.
중요
매우 작거나 매우 큰 표본으로부터의 결과를 해석하는 경우 주의하십시오. 표본이 너무 작으면 적합도 검정이 분포에서 유의한 편차를 탐지하기 위한 검정력이 충분하지 않을 수도 있습니다. 표본이 너무 크면 검정의 검정력이 매우 커서 분포에서 실제적으로 유의하지 않은 작은 편차도 탐지할 수도 있습니다. 분포 적합도를 평가하려면 p-값 외에 확률도를 사용하십시오.
칼슘에 대한 분포 식별
2-모수 지수 분포
* 경고 * 추정 모수의 분산/공분산 행렬이 없습니다. 신뢰 구간을 계산할 때 분계점
모수가 고정되어 있는 것으로 가정합니다.
3-모수 감마 분포
* 경고 * 추정 모수의 분산/공분산 행렬이 없습니다. 신뢰 구간을 계산할 때 분계점
모수가 고정되어 있는 것으로 가정합니다.
칼슘에 대한 분포 ID 그림
칼슘에 대한 분포 ID 그림
칼슘에 대한 분포 ID 그림
칼슘에 대한 분포 ID 그림
기술 통계량
N N* 평균 표준 편차 중위수 최소값 최대값 왜도 첨도
50 0 50.782 2.76477 50.4 46.8 58.1 0.644923 -0.287071
Box-Cox 변환: λ = -4
Johnson 변환 함수:
0.804604 + 0.893699 × Ln( ( X - 46.2931 ) / ( 59.8636 - X ) )
적합도 검정
분포 AD P LRT P
정규 분포 0.754 0.046
Box-Cox 변환 0.414 0.324
로그 정규 분포 0.650 0.085
3-모수 로그 정규 분포 0.341 * 0.017
지수 20.614 <0.003
2-모수 지수 분포 1.684 0.014 0.000
Weibull 분포 1.442 <0.010
3-모수 Weibull 분포 0.230 >0.500 0.000
최소극단값 분포 1.656 <0.010
최대 극단값 분포 0.394 >0.250
감마 분포 0.702 0.071
3-모수 감마 분포 0.268 * 0.006
로지스틱 분포 0.726 0.034
로그 로지스틱 분포 0.659 0.050
3-모수 로지스틱 분포 0.432 * 0.027
Johnson 변환 0.124 0.986
분포 모수의 ML 추정치
분포 위치 모수 형상 모수 척도 모수 분계점
정규 분포* 50.78200 2.76477
Box-Cox 변환* 0.00000 0.00000
로그 정규 분포* 3.92612 0.05368
3-모수 로그 정규 분포 1.69295 0.46849 44.74011
지수 50.78200
2-모수 지수 분포 4.06326 46.71873
Weibull 분포 17.82470 52.13681
3-모수 Weibull 분포 1.47605 4.53647 46.66579
최소극단값 분포 52.22257 2.95894
최대 극단값 분포 49.50370 2.16992
감마 분포 351.04421 0.14466
3-모수 감마 분포 2.99218 1.63698 45.88376
로지스틱 분포 50.57182 1.59483
로그 로지스틱 분포 3.92259 0.03121
3-모수 로지스틱 분포 1.54860 0.32763 45.46180
Johnson 변환* 0.02897 0.97293
* 척도: 수정된 ML 추정치
주요 결과: P
이 결과에서는 여러 분포의 p-값이 0.05보다 큽니다. 3-모수 Weibull 분포(P > 0.50)와 최대 극단값 분포(P > 0.25)의 p-값이 가장 크고, 다른 분포보다 표본 데이터에 더 적합한 것으로 보입니다. 또한 Box-Cox 변환(P = 0.353)과 Johnson 변환(P = 0.986)이 정규 분포를 따르도록 데이터를 변환하는 데 효과적입니다.
참고
여러 분포의 경우 Minitab에서는 추가 모수가 있는 분포에 대한 결과도 표시합니다. 예를 들어, 로그 정규 분포의 경우에는 분포의 2-모수 및 3-모수 버전 둘 다에 대한 결과를 표시합니다. 추가 모수가 있는 분포의 경우, 다른 모수를 추가하면 분포의 적합성이 유의하게 개선되는지 확인하려면 우도 비 검정 p-값(LRT P)을 사용하십시오. 0.05보다 작은 LRT p-값은 적합성이 유의하게 개선된다는 것을 나타냅니다. 자세한 내용을 보려면 개별 분포 식별에 대한 적합도에서 "LRT P"를 클릭하십시오.