個別の分布の識別の例

ある栄養補助食品会社の品質エンジニアが、ビタミン剤カプセルのカルシウム含有量を評価したいと考えています。そこで、無作為にカプセルをサンプル抽出し、そのカルシウム含有量を記録します。データに対してどの統計分析が適切であるかを判断するために、エンジニアはまずデータの分布を調べる必要があります。

エンジニアは、どの分布がデータに最適に適合するかを調べるために個別の分布の識別を実行します。

  1. サンプルデータカルシウム含有量.MTWを開きます。
  2. 統計 > 品質ツール > 個別の分布の識別を選択します。
  3. データの配列で、単一列を選択して、カルシウムを入力します。
  4. サブグループサイズに、「1」と入力します。
  5. OKをクリックします。

結果を解釈する

Minitabには、各分布と変換ごとに確率プロットとp値が表示されます。分布がデータによくあてはまる場合(または変換が有効な場合)、プロット上の点は信頼限界内の直線に従い、p値はα水準より大きくなります。多くの場合、α水準として0.05が使用されます。尤度比検定(LRT)のp値は、追加パラメータを分布に追加することにより適合度が有意に改善されるかどうかを示します。尤度比検定p値が0.05未満であれば、適合度が有意に改善されることを示します。 

これらのデータの場合、3-パラメータワイブル分布(p > 0.500)と最大極値分布(p > 0.250)がデータにうまくあてはまります。3番目のパラメータを追加すると、対数正規分布(LRT P = 0.017)、ワイブル分布(LRT P = 0.000)、ガンマ分布(LRT P = 0.006)、および対数ロジスティック分布(LRT P = 0.027)の適合度が有意に改善されます。

Box-Cox変換(p = 0.324)とJohnson変換(p = 0.986)は、これらのデータで有効です。変換後、正規分布は変換された値によくあてはまります。

2-パラメータ指数

* 警告 * パラメータ推定値の分散/共分散行列は存在しません。信頼区間の計算時に閾値パラメータが固定されたと仮定しました。

3-パラメータガンマ

* 警告 * パラメータ推定値の分散/共分散行列は存在しません。信頼区間の計算時に閾値パラメータが固定されたと仮定しました。

記述統計量

N欠損値平均標準偏差中央値最小最大歪度尖度
50050.7822.7647750.446.858.10.644923-0.287071
Box-Cox変換: λ = -4
Johnson変換関数:
0.804604 + 0.893699×Ln ((X - 46.2931)/(59.8636 - X))

適合度検定

分布ADp値尤度比検定 p値
正規0.7540.046 
Box-Cox変換0.4140.324 
対数正規0.6500.085 
3-パラメータ対数正規0.341*0.017
指数20.614<0.003 
2-パラメータ指数1.6840.0140.000
ワイブル1.442<0.010 
3-パラメータワイブル0.230>0.5000.000
最小極値1.656<0.010 
最大極値0.394>0.250 
ガンマ0.7020.071 
3-パラメータガンマ0.268*0.006
ロジスティック0.7260.034 
対数ロジスティック0.6590.050 
3-パラメータ対数ロジスティック0.432*0.027
Johnson変換0.1240.986 

分布パラメータの最尤推定値

分布位置形状尺度閾値
正規*50.78200  2.76477 
Box-Cox変換*0.00000  0.00000 
対数正規*3.92612  0.05368 
3-パラメータ対数正規1.69295  0.4684944.74011
指数    50.78200 
2-パラメータ指数    4.0632646.71873
ワイブル  17.8247052.13681 
3-パラメータワイブル  1.476054.5364746.66579
最小極値52.22257  2.95894 
最大極値49.50370  2.16992 
ガンマ  351.044210.14466 
3-パラメータガンマ  2.992181.6369845.88376
ロジスティック50.57182  1.59483 
対数ロジスティック3.92259  0.03121 
3-パラメータ対数ロジスティック1.54860  0.3276345.46180
Johnson変換*0.02897  0.97293 
* スケール:調整済み最尤推定値