確率密度関数(PDF)の使用

確率密度関数(PDF)とは

確率密度関数は、ランダム変数の値において高い確率と低い確率の領域を識別するために役立ちます。

離散PDFの例

離散変数の場合、PDFは指定したx値の累積確率を表します。たとえば、あるキャンディのメーカーでさまざまな色で同じ種類のキャンディを作っているとします。黄色のキャンディが全体の30%、オレンジが10%、赤が10%、緑が20%、そして青が30%を占めています。
離散PDF

この棒グラフではキャンディの色のPDFが表示されています。各バーはキャンディの色の確率をパーセントで示しています。

連続PDFの例

確率密度関数(PDF)は、連続確率変数の確率分布を表す式です。たとえば、あるワイン専用のコルクを切り出す機械で異なる直径のコルクを製造しているとします。コルクの直径を表した次の棒グラフでは、それぞれのバーは対応する直径ごとのコルクの比率を表しています。
連続PDF

このPDFの曲線は、コルクの直径です。PDFを使用して、ランダム変数の値において高い確率と低い確率を表す領域を識別します。たとえば、2.8 cm未満の直径のコルクの割合は非常に少なく(1%)なっています。

規格限界のある連続PDF

コルクの直径の規格限界が2.85 cmから3.15 cmの場合、PDFは、この工程で生産されるコルクのうち、規格を満たすすべてのコルクの確率密度値を示すことができます。

PDFの形状は、分布によって異なります。一般的なつりがね型の曲線は、正規分布のPDFを表します。コルクの直径は正規分布に従いますが、ワインボトルからコルクを引き抜くために要する力などの他の測定値は異なる分布に従うでしょう。たとえば、対数正規分布のPDFは右裾が長くなります。
対数正規PDF

ワインボトルによっては、コルクを引き抜くのに大変な力を要します。このため、この力の測定値は多くの場合、対数正規分布のような右裾の長い分布に従います。