仮説検定を使用して分析できるデータの種類

仮説検定は、母集団のさまざまなパラメータを評価するために使用できます。各検定は特定の母数を評価するように設計されていて、母集団の種類によって適切なデータの種類が決まります。関心のある母数と適切なデータの種類がわかれば、最も適切な検定を選択するのに役立ちます。
連続データ

連続データでは、2つの値の間に無数の値があります。連続データは、母平均、中央値、標準偏差、または分散に関して推定を行う場合に使用する必要があります。

長さ、重量、温度など、部品または工程の特性を測定する場合、通常は連続データが得られます。連続データには小数値が含まれることがよくあります。たとえば、品質管理のエンジニアが、平均重量がパッケージラベルに示された値(500g)と異なるかどうかを判断するとします。エンジニアは、箱入りシリアルのサンプルを抽出し、その重量を記録します。

ベルヌイデータ(二項データとも呼ばれる)

ベルヌイデータは、比率またはパーセンテージに関して推定を行うために使用する必要があります。ベルヌイ母集団は二項母集団として解釈できるため、ベルヌイデータはよく二項データとも呼ばれます。

項目、事象、または人を2つのカテゴリのうち1つに分類すると、二項データが得られます。2つのカテゴリは、はい/いいえ、合格/不合格、不良/欠陥なし、のように、相互に排他的である必要があります。たとえば、エンジニアがサンプルを抽出し、重大な亀裂のために使用不能なボルトがないか調べるとします。検査したボルトの数と不合格になったボルトの数を記録します。不良ボルトのパーセントが0.2%未満かどうかを判断します。

ポアソンデータ

関心のある事象の出現率に関する推定を行うには、度数データを使用する必要があります。

特定の期間、領域、またはその他の観測の長さにおける特性、結果、または活動の出現を数えると、ポアソンデータが得られます。ポアソンデータはユニットあたりの度数で評価され、各ユニットは同じサイズになります。たとえば、バス会社の検査官が30日間毎日バスの故障数を数えるとします。この会社では、1日あたりのバスの故障率を判断したいと考えています。