分布の適合を評価するときに考慮する項目

信頼性分析を実行する際の最初の重要なステップは、適切な分布を選択することです。選択した分布がデータにあてはまらない場合、信頼性推定値は不正確になります。データ範囲を超えて外挿する場合にも良好に適合する分布モデルが必要です。信頼性データに最適な分布を選択するには、次の基準を考慮します。
  • その状況の工学的および経験的知識を活用します。たとえば、データは対称分布に従っていますか。ハザード関数は、安定している、増加している、減少しているのいずれですか。同じような状況で、過去にどんな分布が使えましたか。
  • 分布分析を実行し、確率プロットを使用して、候補となる分布を比較するか、選択した分布の適性を評価します。
  • Anderson-Darling適合度統計量やピアソン相関係数を評価します。
    • Anderson-Darling値が大幅に低い場合、一般的に分布の適合度が高いことを示します。Anderson-Darling統計量は、最尤推定法(MLE)および最小二乗推定法(LSE)の両方に対して計算されます。
    • ピアソン相関係数が大幅に高い場合、分布の適合度が高いことを示します。相関係数は、LSE法に使用できます。
  • 異なる分布が結論にどのように影響するかを評価します。
    • いくつかの分布がデータに適切に適合し、類似した結論を出している場合は、おそらくどの分布を選んでも差し支えないでしょう。
    • 結論が選択した分布に応じて変わる場合は、最も保守的な結論を報告するか、さらに情報を収集します。

歪んだデータまたは対称的なデータのモデル化に使用できる分布

データセットを複数の分布でモデル化できたり、1つの分布に1つ、2つ、または3つのパラメータがある場合がよくあります。たとえば、各タイプのデータにいくつかの分布が適合できる可能性があります。
右方向に歪んだデータ
多くの場合、ワイブル分布または対数正規分布がデータに良好に適合します。
対称的なデータ
多くの場合、ワイブル分布または対数正規分布を適合できます。正規分布を適合して同様の結果を得られる場合もあります(裾の重さによります)。
左方向に歪んだデータ
多くの場合、ワイブル分布または最小極値分布を適合できます。
特定のデータセットが2つまたは3つのパラメータを使用してモデル化できる場合があります。データによっては3-パラメータモデルの方が適合度が高い場合がありますが、モデルの過剰な適合になる場合もあります。過剰な適合とは、モデルがサンプルデータに良好に適合しているけれども、同じ母集団からの別のサンプルには適合しないことを意味します。一般に、専門家は適合する中で最も単純なモデルを選択することを推奨しています。