個別の分布の識別の方法

最尤推定値

分布におけるパラメータの最尤推定値は、パラメータに関する尤度関数を最大化することによって計算されます。分布の尤度関数では、与えられたデータセットについて、その分布の下でそのデータが生成される尤度を推定します。

分布を定義するパラメータの最尤推定値を計算するため、Newton-Raphsonアルゴリズムが使用されます。Newton-Raphsonアルゴリズムは、関数の最大値を算出する再帰的な方法です(1)。次にこの百分位数が分布から算出されます。

Minitabでは、正規分布と対数正規分布を除くすべての分布の場合に、この最尤法を使用してパラメータの推定値を計算します。正規分布と対数正規分布の場合、Minitabでは、不偏パラメータ推定値を計算します。

適合度検定

Minitabでは、アンダーソン-ダーリング統計量を使用して適合度検定を実行します。

Z = F(X)で、F(X)は累積分布関数であるとします。サンプルのX1, .., Xnは、Z(i) = F(Xi), i=1,.., nを示すと仮定します。Z(i)をZ(1) < Z(2) <...<Z(n)の昇順で並び替えます。すると、アンダーソン-ダーリング検定の(A2)は次のように計算されます。

  • A2 = –n - (1/n) Σi[(2i – 1) log Z(i) + (2n + 1 – 2i) log (1 – Z(i))]

修正されたアンダーソンーダーリングの適合度検定の統計量が各分布に対して計算されます。p値はディアゴスティーノとステフェンズの次の文献の表4.8~4.22に基づいています。2 正しいp値が表に見つからない場合、Minitabでは、p値の範囲を使用した内挿法に基づいてp値が計算されます。

アンダーソンーダーリング検定のp値は、ワイブル分布を除いて、3パラメータ分布では使用できません。

尤度比検定

尤度比検定では、より大きな分布族の適合度を同じ族のサブセットと比較して、より大きな分布のほうが適合度が有意に改善されるかどうかを判断します。たとえば、2-パラメータ指数分布の場合、尤度比検定では2-パラメータ指数分布族の適合度を1-パラメータ指数分布族の適合度(第2パラメータが0になっているサブセット)と比較します。2-パラメータ指数分布での適合度が有意に改善される場合、尤度比検定統計量のp値は非常に小さな値になります。

尤度比検定統計量は、次のようにして計算します。

より大きな分布族(たとえば、3-パラメータ分布族)のパラメータベクトルの最尤推定(MLE)をA、対数尤度をL(A)とします。それよりも小さな対応する分布族(たとえば、対応する2-パラメータ分布族)のパラメータベクトルのMLEをB、および対数尤度をL(B)とします。

尤度比検定統計量 = 2 * L(A) 2 * L(B).

帰無仮説では、より小さな分布族のほうがデータにうまくあてはまります。尤度比検定統計量は、「df = ベクトル(A)の次元 - ベクトル(B)の次元」となるカイ二乗分布です。

1 W. Murray, Ed. (1972). Numerical Methods for Unconstrained Optimization. Academic Press.
2 M.A. Stephens(1986年)第4章「Tests based on EDF statistics」『Goodness-of-Fit Techniques』97~193頁、R.B. D'Agostino、M.A. Stephens編、Marcel Dekker, Inc.