포아송 분포

이 항목의 내용

포아송 분포의 정의
발생률의 정의
포아송 분포와 이항 분포의 차이

포아송 분포의 정의

포아송 분포는 람다(λ)라는 하나의 모수로 지정됩니다. 이 모수는 평균과 분산이 같습니다. 람다가 충분히 큰 값으로 증가하면 정규 분포 (λ, λ)가 포아송 분포를 근사시키기 위해 사용될 수 있습니다.

포아송 분포는 한정된 관측 공간에서 사건이 발생하는 횟수를 설명하기 위해 사용합니다. 예를 들어, 포아송 분포는 비행기 기계 시스템의 결점 수나 콜 센터에 대한 시간당 통화 수를 설명합니다. 품질 관리, 신뢰성/생존 연구 및 보험에 포아송 분포가 자주 사용됩니다.

다음과 같은 조건을 충족하는 경우 변수가 포아송 분포를 따릅니다.

데이터는 사건 횟수(상한이 없는 음수가 아닌 정수)입니다.
모든 사건은 독립적입니다.
해당 기간 동안 평균 비율은 변경되지 않습니다.

다음 그래프는 람다가 서로 다른 포아송 분포를 나타냅니다.

발생률의 정의

발생률은 평균(λ)을 관측 공간 크기로 나눈 값입니다. 발생률은 여러 관측 공간에서 수집된 포아송 카운트를 비교하는 데 유용합니다. 예를 들어, 교환대 A는 5시간 동안 50통의 전화를 수신하고 교환대 B는 10시간 동안 80통의 전화를 수신합니다. 이 값들은 관측 공간이 서로 다르기 때문에 직접 비교할 수 없습니다. 이 카운트를 비교하려면 발생 비율을 계산해야 합니다. 교환대 A의 비율은 (50통/5시간) = 10통/1시간입니다. 교환대 B의 비율은 (80통/10시간) = 8통/1시간입니다.