적절한 분포를 선택하는 것은 신뢰도 분석을 수행하는 필수적인 첫 단계입니다. 선택된 분포가 데이터에 제대로 적합하지 않으면 신뢰도 추정치가 부정확하게 됩니다. 데이터 범위를 넘어 추정하기 위해서도 잘 적합되는 분포가 필요합니다. 신뢰도 데이터에 가장 적절한 분포를 선택하려면 다음 기준을 고려해야 합니다.
상황에 대한 공학적이고 경험적인 지식을 이용합니다. 예를 들어, 데이터가 대칭 분포를 따르는가? 위험이 일정하다, 증가하는가 또는 감소하는가? 비슷한 상황에서 과거에는 어떤 분포가 적용되었는가?
분포 분석을 수행하고 확률도를 사용하여 후보 분포를 비교하거나 선택한 분포가 적절한지 평가합니다.
Anderson-Darling 적합도 통계량 및 Pearson 상관 계수 평가:
Anderson-Darling 값이 낮을수록 일반적으로 분포가 더 적합하다는 것을 나타냅니다. 최대우도 추정 방법(MLE)과 최소 제곱 추정 방법(LSE)에서 모두 Anderson-Darling 통계량이 계산됩니다.
Pearson 상관 계수 값이 클수록 분포가 더 적합하다는 것을 나타냅니다. 상관 계수는 최소 제곱 추정 방법(LSE) 방법에 사용할 수 있습니다.
분포가 다를 경우 결론에 어떤 영향을 미치는지 평가:
여러 개의 분포가 데이터에 적절한 적합치를 제공하고 비슷한 결론을 제공한다면 어떤 분포를 선택할 것인 지는 그리 중요한 사항이 아닐 수도 있습니다.
선택한 분포에 따라 결론이 다르다면 가장 보수적인 결론을 보고하거나 더 많은 정보를 수집하기를 원할 것입니다.
치우친 데이터나 대칭 데이터를 모형화하기 위해 사용할 수 있는 분포
대부분의 경우 둘 이상의 분포 또는 모수가 1개, 2개 또는 3개인 분포를 사용하여 데이터 집합을 모형화할 수 있습니다. 예를 들어, 각 데이어 유형에 여러 분포가 적합할 수 있습니다.
오른쪽으로 치우친 데이터
보통 Weibull 또는 로그 정규 분포를 사용하여 좋은 적합치를 얻을 수 있습니다.
대칭 데이터
보통 Weibull 분포 또는 로그 정규 분포를 적합할 수 있습니다. 때로는 정규 분포를 사용하여 (꼬리의 두께에 따라) 비슷한 결과를 얻을 수도 있습니다.
왼쪽으로 치우친 데이터
보통 Weibull 분포 또는 최소 극단값 분포를 적합할 수 있습니다.
때로는 2개 또는 3개의 모수를 사용하여 특정 데이터 집합을 모형화할 수 있습니다. 3-모수 모형은 일부 데이터의 경우 더 적합하지만 모형을 과대 적합시킬 수도 있습니다. 과대 적합은 모형이 표본 데이터를 잘 적합하지만, 동일한 모집단에서 추출된 다른 표본을 적합하지 않을 수도 있음을 의미합니다. 일반적으로 전문가들은 가장 간단한 모형을 선택할 것을 권합니다.
신뢰도 데이터를 모형화하기 위해 사용되는 특정 분포에 대한 자세한 내용은 다음 항목에서 확인하십시오.