二項分布は、一定の試行回数における事象数をモデル化する離散型分布です。各試行で生じ得る結果は2つあり、事象は各試行での対象となる結果です。

二項分布は、検査での合格または不合格、あるいは選挙での勝利と敗北のように、結果を事象または非事象として表し、事象の大きさではなく出現回数に関心がある場合に使用します。一般に品質管理、世論調査、医学研究、および保険の分野などで使用されます。

たとえば、二項分布を使用して、各試行での不良品の確率が0.02の場合に、25個の製品サンプルで3個以上の不良品が検出される確率を計算します。不良品の数(X)は、n = 25、およびp = 0.02で二項分布に従います。

試行回数n中の事象数(X)は、次の条件が満たされている場合に二項分布に従います。
  • 試行回数が固定されている。
  • 各試行が他の試行とは独立している。
  • 各試行の結果が、事象または非事象のいずれかである。
  • 事象の確率が各試行で同じである。
二項分布の特性の1つに、n値が大きい場合、二項分布は正規分布で適度に近似することができる、というものがあります。たとえば次の二項分布では、n = 100、p = 0.5です。