離散データ分布は、離散的な事象が出現する確率を表します。
たとえば、離散型分布で、カリフォルニアの家庭が自動車を0台、1台、2台、3台、または4台持っている確率を表すことができます。車両管理局は、この情報を使用して家庭あたりの所有自動車数が2台以下の確率を判断できます。離散型分布は、カスタマーコールセンター、病院、および金融機関などのサービス品質の設定値としてよく使用されます。
離散型分布とは、目的の変数の異なる数値およびそれらに対応する確率を一覧にしたものです。確率の和は必ず1になります。上記の自動車を例にした場合の各台数ごとの確率は以下のとおりです。
家庭あたりの所有自動車数 | 確率 |
---|---|
0 | 0.03 |
1 | 0.13 |
2 | 0.70 |
3 | 0.10 |
4 | 0.04 |
離散型分布の値は、数値でなくてはなりません。ただし、数値を使用してカテゴリ変数を表すこともできます。たとえば、クレジットカード会社が顧客からの電話の種類を把握しようとしています。Minitabでは、電話の種類を1 =年利が高すぎる、2 =特典(エアマイルなど)に関する質問、というようにコード化して分布を作成できます。
離散型分布は、離散データに対してその他の分布(ベルヌイ分布、二項分布、超幾何分布、整数値からなる分布、およびポアソン分布)が適切でない場合に使用します。