指数分布

指数分布を使用して連続するポアソン工程のイベント間の時間をモデル化します。一定の割合で独立したイベントが発生すると仮定します。

この分布は、製品やシステム、待ち行列理論、およびマルコフ連鎖の信頼性分析などの幅広い用途に使用されます。

たとえば、次のモデル化に指数分布を使用できます。
  • 電子部品が故障するまでの時間
  • ターミナルでの乗客の到着時間の間隔
  • 顧客がサービスを受けるまで列に並んで待つ時間
  • 債務不履行とみなされるまでの時間(信用リスクのモデリング)
  • 放射性核が崩壊するまでの時間
2パラメータ指数分布は、尺度パラメータとしきい値パラメータによって定義されます。しきい値パラメータθが正の場合は、分布の開始位置が距離θだけ右に移動します。たとえば、θ = 5を持つシステムの故障について調べるとします。これは、故障が発生し始めるのはオペレーションを実施してから5時間後以降であり、それ以前には発生しないという意味です。

1パラメータ指数分布では、しきい値はゼロで分布は尺度パラメータによって定義されます。1パラメータ指数分布では、尺度パラメータは平均値と等しくなります。

無記憶性とは

指数分布の重要な特性はメモリレスであるということです。イベントの確率は過去の試行には依存しません。このため、出現率は一定のままです。

無記憶性とは、成分の残りの寿命が現在の年齢に左右されないことを意味します。たとえば、硬貨を投げるランダム試行回数は無記憶性を表します。損耗や破損のあるシステムは、今後使用中に障害を起こす可能性が高くなるため無記憶性ではありません。

ガンマ分布

ガンマ分布を使用して、右方向に歪んだ0より大きい正のデータ値をモデル化します。ガンマ分布は、信頼性/生存時間の分析でよく使用されます。たとえば、電気部品の故障時期をガンマ分布で説明することができます。特定のタイプの電気部品のほとんどは同じ時期に故障しますが、故障するまでに長い時間がかかるものもあります。

ガンマ分布は、形状パラメータと尺度パラメータによって定義される連続分布です。3-パラメータガンマ分布は、形状、尺度、およびしきい値パラメータで定義されます。たとえば、次のグラフでは、ガンマ分布は、しきい値を0.0に設定し、異なる形状値と尺度値で定義されます。ガンマ分布のほとんどの値は互いの周辺で発生していますが、一部の値は上裾にたなびいています。

形状パラメータが整数の場合、ガンマ分布はErlang分布と呼ばれることがあります。Erlang分布は、待ち行列理論の応用でよく使われています。

ロジスティック分布

ロジスティック分布を使用すると、正規分布よりも裾が長くて尖度が高いデータ分布をモデル化できます。

ロジスティック分布は、尺度パラメータと位置パラメータによって定義される連続分布です。ロジスティック分布には形状パラメータがありません。このため、確率密度関数の形状は1つだけとなります。このため、確率密度関数の形状は1つだけとなります。ただし、ロジスティック分布の方が裾が長くなります。
尺度パラメータの影響
次のグラフは、ロジスティック分布でのさまざまな尺度パラメータ値の影響を示しています。
位置パラメータの効果
次のグラフは、ロジスティック分布でのさまざまな位置パラメータ値の影響を示しています。

対数ロジスティック分布

対数ロジスティック分布は、変数の対数がロジスティック分布に従う場合に使用します。たとえば、成長モデルで使用されたり、生物統計学や経済学などの分野で2値応答をモデル化するときに使用されます。

対数ロジスティック分布は、尺度パラメータと位置パラメータによって定義される連続分布です。3-パラメータ対数ロジスティック分布は、尺度、位置、およびしきい値パラメータで定義されます。

次のグラフは、スケール=1.0、位置=0.0、しきい値=0.0の対数ロジスティック分布を図示します。

対数ロジスティック分布は、フィスク(Fisk)分布としても知られています。

対数正規分布

ランダム変数の対数が正規分布である場合に、対数正規分布を使用します。ランダム変数が0より大きい場合に使用します。たとえば、対数正規分布は、信頼性分析や金融分野(株価の動きのモデル化など)で使用されます。

対数正規分布は、位置パラメータと尺度パラメータによって定義される連続分布です。3-パラメータ対数正規分布は、尺度、位置、およびしきい値パラメータで定義されます。

対数正規分布の形状は、対数ロジスティック分布およびワイブル分布に似ています。たとえば、スケール=1.0、位置=0.0、しきい値=0.0の対数正規分布を図示します。

正規分布

正規分布は、平均(μ)と標準偏差(σ)によって決まる連続分布です。平均は、つりがね型曲線の頂点または中央です。標準偏差は分布の広がりを決定します。

たとえば、正規分布の次のグラフでは、おおよそ68%の観測値が平均の標準偏差+/- 1以内にあり、95%は(陰影領域で示されている通り)平均の標準偏差+/- 2以内、そして99.7%が平均の標準偏差+/- 3以内にあります。

正規分布は最も一般的な統計的分布です。これは、多くの物理的、生物学的、および社会的な測定状況では通常、おおよその正規性が表れるためです。これは、多くの物理的、生物学的、および社会的な測定状況では通常、おおよその正規性が表れるためです。

最小極値分布と最大極値分布

最大極値分布と最小極値分布は密接に関連しています。たとえば、Xが最大極値分布の場合、-Xは最小極値分布になります。逆も同様です。

最小極値分布

最小極値分布は、位置パラメータと尺度パラメータによって定義されます。最小極値分布を使用すると、ランダム観測値の分布の最小値をモデル化できます。最小極値分布は、その最も弱い部品が故障すると同時に故障するシステムの故障までの時間をモデル化するためによく使用されます。最小極値分布では、最低温度や干ばつ期の降雨などの極端な現象を説明します。最小極値分布は左方向に歪みます。たとえば、鎖の破壊強さの分布が左に歪むことが多いです。これは、最も強度の低い輪が壊れたときに鎖が壊れる傾向にあるからです。この分布では、強度の低い標本がいくつか左に分布し、大多数の強度が上裾に分布します。

最大極値分布

最大極値分布は、位置パラメータと尺度パラメータによって定義されます。最大極値分布を使用すると、ランダム観測値の分布の最大値をモデル化できます。この分布では、極度の風速や莫大な保険損失などの極端な現象が表されます。最大極値分布は右方向に歪みます。たとえば、時間の経過に伴う河川の水位の分布は、右側の2、3件の極端な水位と下側の裾の位置にある大半の水位によって、多くの場合右方向に歪みます。

ワイブル分布

ワイブル分布は、工学、医学的研究、品質管理、金融、および気象学などの幅広い用途のモデル化に使用できる、万能な分布です。たとえば、この分布は信頼性分析と共に、システムの故障までの時間データをモデル化する場合によく使用されます。また、工程能力分析の歪んだ工程データをモデル化するためにも使用されます。

ワイブル分布は、形状、尺度、しきい値のパラメータによって表され、3パラメータワイブル分布とも呼ばれます。しきい値パラメータがゼロの場合は、2-パラメータワイブル分布と呼ばれます。2パラメータワイブル分布は正の変数でのみ定義されます。3パラメータワイブル分布では、ゼロと負のデータを使用できますが、2パラメータワイブル分布ではすべてのデータはゼロより大きくなければなりません。

パラメータの値に応じて、ワイブル分布はさまざまな形状になります。

形状パラメータの影響
形状パラメータは、データがどのように分布するかを表します。3の形状は正規曲線に近似します。1などの低い値の形状は、右方向に歪んだ曲線になります。10などの高い値の形状は、左方向に歪んだ曲線になります。
尺度パラメータの影響
尺度(特性寿命)はデータの63.2%の百分位です。尺度は、しきい値に対するワイブル曲線の位置を定義し、平均が正規曲線の位置を定義する方法と似ています。たとえば、尺度20は、装置の63.2%がしきい値時刻後20時間以内に故障することを示します。
しきい値パラメータの影響
しきい値パラメータは、分布の0からのシフトを表します。負のしきい値では分布が0の左側にシフトし、正のしきい値では分布が0の右側にシフトします。すべてのデータはしきい値より大きい値である必要があります。すべてのデータはしきい値よりも大きくなければなりません。2パラメータワイブル分布は3パラメータワイブル分布と同じですが、しきい値は0になります。たとえば、3パラメータワイブル分布(3,100,50)では、2パラメータワイブル分布(3,100)の形状と広がりと同じですが、右側に50単位シフトされています。