個別の分布の識別の分布の百分位数

個別の分布の識別によって提供されるすべての分布の百分位数統計量の定義と解釈について解説します。

パーセントと百分位数

選択したパーセントのデータの百分位数の推定を選択すると、Minitabには、百分位数の表が表示されます。Pパーセントに対する百分位数は、各分布の母集団値のPパーセントがそれよりも下の値になると期待される値です。デフォルトでは、0.135%、0.5%、2%、および5%に対する百分位数が表示されます。

解釈

確率プロットと適合度の測度だけに基づいて最適な分布を決めることは、困難な場合もあります。その場合は、各分布の選択したパーセント値に対する百分位数を比較して、分布の違いによる結論への影響を評価することができます。
  • 数種類の分布が妥当な範囲でデータに適合し、その百分位数の値が十分に近似しているためにどの分布を使用する場合でも同様の結論が得られる可能性が高い場合は、おそらくどの分布を選択するかは問題ではありません。
  • 妥当な適合度を示す各分布の百分位数が分析結果に影響するほど異なっている場合は、アプリケーションについて最も控えめな結果が導かれる分布を選択することができます。

たとえば、工程の下側規格限界が46.2だとします。その場合、最大極値分布では、分布の下側の裾で工程能力を評価する場合に、やや控えめな結果が導かれます。その差異がアプリケーションにとって重要な場合は、最大極値分布を使用して、工程能力を過大評価する可能性を排除することができます。

百分位数表 パーセ 95.0%信頼 分布 ント 百分位数 標準誤差 区間 正規 0.5 43.6604 0.81715 42.1 45.3 Box-Cox変換 0.5 0.0000 0.00000 0.0 0.0 対数正規 0.5 44.1612 0.70063 42.8 45.6 3-パラメータ対数正規 0.5 46.3662 0.51400 45.4 47.4 指数 0.5 0.2545 0.03600 0.2 0.3 2-パラメータ指数 0.5 46.7391 0.00288 46.7 46.7 ワイブル 0.5 38.7359 1.31065 36.3 41.4 3-パラメータワイブル 0.5 46.7913 0.17247 46.7 47.1 最小極値 0.5 36.5526 1.76758 33.1 40.0 最大極値 0.5 45.8856 0.43646 45.0 46.7 ガンマ 0.5 44.0724 0.72433 42.7 45.5 3-パラメータガンマ 0.5 46.4331 0.17091 46.1 46.8 ロジスティック 0.5 42.1299 1.03294 40.1 44.2 対数ロジスティック 0.5 42.8370 0.86658 41.2 44.6 3-パラメータ対数ロジスティック 0.5 46.2924 0.70522 45.5 47.7 Johnson変換 0.5 -2.4771 0.28756 -3.0 -1.9

これらの結果では、確率プロットとp値(非表示)に基づけば、3-パラメータワイブル分布と最大極値分布の両方がデータに妥当な範囲で適合しています。3-パラメータワイブル分布の場合は、データの1%が46.8668より小さい値になると期待できます。また最大極値分布の場合は、データの1%が46.1898以下になると期待できます。状況に応じて、この追加情報に基づき、適合性の高い分布を選択することができます。1つの値によってより控えめな推定値が得れる場合は、その分布を選択できます。

Box-CoxとJohnson変換の値は、生データではなく変換された値に基づいているため、百分位数の解釈は難しくなります。

百分位数の標準誤差

百分位数の標準誤差により、同じ母集団からサンプルを繰り返し抽出する場合に得られるサンプル百分位数間の変動性を推定します。平均の標準誤差によってサンプル間の変動性が推定されるのに対し、標準偏差では単一サンプル内の変動性が測定されます。

解釈

百分位数の標準誤差を使用して、サンプル百分位数による各分布の母集団百分位数の推定値の精度を判断します。

標準誤差の値が小さいほど、母集団百分位数の推定値の精度が高いことを示します。通常は、標準偏差が大きいほど標準誤差が大きくなり、母集団百分位数の推定値の精度は低くなります。また、サンプルサイズが大きいほど標準誤差が小さくなり、母集団百分位数の推定値の精度は高くなります。

Minitabでは、百分位数の標準誤差を使用して、母集団百分位数の値の範囲である信頼限界区間を計算します。

百分位数の信頼区間(CI)

信頼区間は、母集団百分位数の値が含まれる可能性が高い範囲です。信頼区間は、下限と上限によって定義されます。限界値は、百分位数のサンプル推定値の誤差幅を算定することによって計算されます。下側信頼限界により、百分位数がそれより大きくなる可能性が高い値が定義されます。上側信頼限界により、百分位数がそれより小さくなる可能性が高い値が定義されます。

解釈

データのサンプルはランダムであるため、工程から収集された2つのサンプルによる百分位数の推定値が同一になる確率は低くなります。工程の百分位数の実際値を計算するには、工程で生成されるすべての項目のデータを分析する必要がありますが、これは現実的ではありません。代わりに、信頼区間を使用して、百分位数の値が含まれる確率が高い範囲を算定することができます。

信頼水準が95%の場合は、百分位数の実際値が信頼区間に含まれるということを95%の信頼度で確信できます。つまり、工程から100個のサンプルをランダムに収集する場合、サンプルのおよそ95個において百分位数の実際値が含まれる区間が作成されると期待できます。

信頼区間の幅には、サンプルサイズが大きくなるほど、またはデータの変動性が小さくなるほど、狭くなる傾向があります。信頼区間が狭い場合は、サンプル推定値を信頼することができ、サンプルのランダム抽出による変動性による影響を強く受ける可能性が低いことを示します。百分位数の信頼区間が広い場合は、百分位数点の推定値を使用して工程に関する結論を導くときに慎重に行う必要があります。信頼区間が広い場合は、信頼区間の上限または下限のうち、どちらであれアプリケーションに関してより控えめな結果を生み出す値に基づいて、百分位数の推定値を求めることができます。

たとえば、最大極値分布の結果は、データの1%がサンプル推定値に基づいた値である46.1898より小さくなると期待できることを示しているとします。95%信頼区間は45.4、47です。工程の下側規格限界が47だとします。慎重であるためには、百分位数の推定値として、信頼区間の下限値(45.4)を使用することができます。下限値を使用することにより、データの1%が45.4より小さい値になると期待でき、この状況ではより控えめな推定値となります。

百分位数表 パーセ 95.0%信頼 分布 ント 百分位数 標準誤差 区間 正規 0.5 43.6604 0.81715 42.1 45.3 Box-Cox変換 0.5 0.0000 0.00000 0.0 0.0 対数正規 0.5 44.1612 0.70063 42.8 45.6 3-パラメータ対数正規 0.5 46.3662 0.51400 45.4 47.4 指数 0.5 0.2545 0.03600 0.2 0.3 2-パラメータ指数 0.5 46.7391 0.00288 46.7 46.7 ワイブル 0.5 38.7359 1.31065 36.3 41.4 3-パラメータワイブル 0.5 46.7913 0.17247 46.7 47.1 最小極値 0.5 36.5526 1.76758 33.1 40.0 最大極値 0.5 45.8856 0.43646 45.0 46.7 ガンマ 0.5 44.0724 0.72433 42.7 45.5 3-パラメータガンマ 0.5 46.4331 0.17091 46.1 46.8 ロジスティック 0.5 42.1299 1.03294 40.1 44.2 対数ロジスティック 0.5 42.8370 0.86658 41.2 44.6 3-パラメータ対数ロジスティック 0.5 46.2924 0.70522 45.5 47.7 Johnson変換 0.5 -2.4771 0.28756 -3.0 -1.9

これらの結果では、最大極値分布を使用することにより、データの1%がサンプル推定値に基づいた値である46.198より小さくなると期待できます。95%信頼区間は(45.4、47)です。工程の下側規格限界が47だとします。慎重であるためには、百分位数の推定値として、信頼区間の下限値(45.4)を使用することができます。下限値を使用することにより、データの1%が45.4より小さい値になると期待でき、この状況ではより控えめな推定値となります。

Box-CoxとJohnson変換の値は、生データではなく変換された値に基づいているため、百分位数の解釈は難しくなります。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください