許容限界区間 (非正規分布)のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データを収集し、分析を実行し、結果を解釈するときには、次のガイドラインを考慮してください。

データは連続量でなければならない
連続データは、小数値または十進数値を含め、連続スケールに沿った値の範囲内に入る潜在的に任意の数値となる測定値です。一般的な例には、長さ、重量、温度などの測定値があります。
パラメトリックな方法の結果を使用するには、データが選択した分布に従わなければならない
データが選択した分布に従っている場合は、パラメトリックな方法の方がノンパラメトリックな方法よりも正確かつ経済的です。パラメトリックな方法では、選択した分布がデータに適してさえいれば、観測値が少なくても誤差幅は小さくできます。
パラメトリックな方法は選択した分布から大きく離れるデータに対して頑健ではありません。パラメトリックな方法は、母集団が選択した分布に従うと分かっている場合のみ使用します。分母が選択した分布に従うかどうか確信がない、または従わないと分かっている場合は、ノンパラメトリックな方法を使用します。
ノンパラメトリック法の十分なデータを収集する
通常、ノンパラメトリックな方法ではパラメトリックな方法よりも大きなサンプルサイズが必要とされます。たとえば、区間内の母集団の最小パーセントが95%の場合、許容限界区間が正確となるにはサンプルサイズはおよそ90以上でなければなりません。区間内の母集団のパーセントが大きいほど、サンプルサイズは大きくある必要があります。たとえば、区間内の母集団の最小パーセントが99%の場合、正確な両側95%の許容限界区間を得るにはサンプルサイズはおよそ500以上でなければなりません。正確な許容限界区間を得るには、達成された信頼水準は目標信頼水準に近くなければなりません。サンプルサイズが足りない場合、ノンパラメトリック法の区間は負の無限大から正の無限大にまたがる非有益な区間となります。この場合、Minitabではデータの範囲に基づいて有限な区間が表示されます。その結果、得られる信頼区間は目標の信頼区間よりもかなり低くなります。