적합한 분포를 선택하는 것은 공정 능력 분석을 실시하는 데 필요한 첫 단계입니다. 선택한 분포에서 데이터를 제대로 적합시키지 않으면 공정 능력 추정치가 부정확해집니다.
대부분의 경우 공정에 대한 공학 및 과거 지식을 사용하여 공정 데이터에 적합한 분포를 찾는 것이 가장 좋습니다. 예를 들어, 데이터가 대칭적인 분포를 따르는가? 비슷한 상황에서 과거에는 어떤 분포가 적용되었는가?
확률도와 적합도 측도를 기반으로 가장 적합한 분포를 결정하기 어려운 경우도 있습니다. 선택한 분포에 따라 결론이 어떻게 달라지는지 확인하려면 선택한 여러 개별 분포 식별의 백분위수 표를 사용하십시오.
여러 개의 분포가 데이터에 충분한 적합도를 제공하고 비슷한 결론을 제공한다면 어떤 분포를 선택할 것인 지는 그리 중요하지 않을 수 있습니다. 반면에, 선택한 분포에 따라 결론이 다르다면 가장 보수적인 결론을 보고하거나 더 많은 정보를 수집하고자 할 것입니다.
어느 분포 또는 변환이 데이터에 가장 적합한지 확인하려면 공정 능력 분석을 수행하기 전에 개별 분포 식별을 사용합니다.
예를 들어, 한 엔지니어가 세라믹 타일의 뒤틀림 정도에 대한 데이터를 수집합니다. 데이터 분포가 알려져 있지 않으므로, 엔지니어는 데이터에 대해 개별 분포 식별을 수행하여 Johnson 변환 후 지수 분포와 정규 분포 간의 적합도를 비교합니다.
이 확률도를 보면 지수 분포의 적합도가 낮습니다. p-값은 데이터가 지수 분포를 따른다는 귀무 가설을 기각할 수 있을 만큼 충분히 낮습니다.
그러나 Johnson 변환을 적용한 후 p-값이 크고 거의 모든 데이터 점이 정규 확률도의 신뢰 한계 내에 들어가기 때문에 데이터가 정규 분포에 아주 가깝게 따릅니다.