1サンプルポアソン率のすべての統計量を解釈する

1サンプルポアソン率検定で使用されるすべての統計量の定義と解釈について解説します。

観測の長さ

ポアソン工程では、時間、領域、量、項目数など指定された観察範囲における特定の事象の発生数を数えます。観測の長さは、各観測範囲の規模、期間、またはサイズを表します。

解釈

Minitabでは、観測の長さを使用してサンプル率が最適な形式に変換されます。

たとえば、サンプルの観測値ごとに1年間の事象数を数える場合は、長さを1に指定すると1年間の出現率を、長さを12に指定すると1か月間の出現率を表します。

Minitabでは、出現総数、サンプルサイズ(N)、観測の長さを使用してサンプル率が計算されます。たとえば、検査担当者が1箱に入っているタオルの欠陥数を検査するとします。裂け目が1か所、糸のほつれが2か所(合計3つの欠陥)など、一枚のタオルに複数の欠陥が見つかる場合があります。1箱には10枚のタオルが入っています。検査担当者は、全部で50箱サンプリングし、合計122か所の欠陥を見つけました。
  • 検出担当者は、122か所の欠陥を見つけたので、出現総数は122です。
  • また、検査担当者が抽出したサンプルは50箱なので、サンプルサイズ(N)は50です。
  • タオル1枚あたりの欠陥数を算定するため、検査担当者は、各箱に入っているタオルが10枚であることから、観測の長さとして10を使用します。また1箱あたりの欠陥数を算定するため、検査担当者は観測の長さとして1を使用します。
  • サンプル率は、(出現総数 / N) / (観測の長さ) = (112/50) / 10 = 0.224です。よって、1枚当たりの平均欠陥数は0.244になります。

帰無仮説と対立仮説

帰無仮説と対立仮説は、ある母集団についての相互に排他的な2つの仮説です。仮説検定手法では、サンプルデータを用いて帰無仮説を棄却するかどうかを判断します。
帰無仮説
帰無仮説では母集団パラメータ(平均や標準偏差など)は仮説値に等しいと仮定します。帰無仮説とは多くの場合、前回の分析や専門知識を基にした最初の主張を指します。
対立仮説
対立仮説では、母集団パラメータは帰無仮説の仮説値よりも小さい、大きい、異なると仮定します。対立仮説とは、真であると確信できる、または真であることの証明が期待できる仮説を指します。

出力では、帰無仮説と対立仮説により、仮説率として正しい値を入力したことを検証できます。

出現総数

出現総数は、サンプル内で出現する事象の出現回数です。

Minitabでは、出現総数、サンプルサイズ(N)、観測の長さを使用してサンプル率が計算されます。たとえば、検査担当者が1箱に入っているタオルの欠陥数を検査するとします。裂け目が1か所、糸のほつれが2か所(合計3つの欠陥)など、一枚のタオルに複数の欠陥が見つかる場合があります。1箱には10枚のタオルが入っています。検査担当者は、全部で50箱サンプリングし、合計122か所の欠陥を見つけました。
  • 検出担当者は、122か所の欠陥を見つけたので、出現総数は122です。
  • また、検査担当者が抽出したサンプルは50箱なので、サンプルサイズ(N)は50です。
  • タオル1枚あたりの欠陥数を算定するため、検査担当者は、各箱に入っているタオルが10枚であることから、観測の長さとして10を使用します。また1箱あたりの欠陥数を算定するため、検査担当者は観測の長さとして1を使用します。
  • サンプル率は、(出現総数 / N) / (観測の長さ) = (112/50) / 10 = 0.224です。よって、1枚当たりの平均欠陥数は0.244になります。

N

サンプルサイズ(N)は、サンプル内の出現数をカウントする回数です。

解釈

サンプルサイズは、信頼区間、検定の検出力、および出現率に影響します。

通常、サンプルが大きいほど信頼区間は狭くなります。サンプルサイズが大きい場合は、検定による差の検出力も高くなります。詳細は、検出力とはを参照してください。

Minitabでは、出現総数、サンプルサイズ(N)、観測の長さを使用してサンプル率が計算されます。たとえば、検査担当者が1箱に入っているタオルの欠陥数を検査するとします。裂け目が1か所、糸のほつれが2か所(合計3つの欠陥)など、一枚のタオルに複数の欠陥が見つかる場合があります。1箱には10枚のタオルが入っています。検査担当者は、全部で50箱サンプリングし、合計122か所の欠陥を見つけました。
  • 検出担当者は、122か所の欠陥を見つけたので、出現総数は122です。
  • また、検査担当者が抽出したサンプルは50箱なので、サンプルサイズ(N)は50です。
  • タオル1枚あたりの欠陥数を算定するため、検査担当者は、各箱に入っているタオルが10枚であることから、観測の長さとして10を使用します。また1箱あたりの欠陥数を算定するため、検査担当者は観測の長さとして1を使用します。
  • サンプル率は、(出現総数 / N) / (観測の長さ) = (112/50) / 10 = 0.224です。よって、1枚当たりの平均欠陥数は0.244になります。

サンプル率

事象のサンプル出現率は、サンプル内の観測値の単位長さあたりに出現する事象の平均出現回数です。

Minitabでは、出現総数、サンプルサイズ(N)、観測の長さを使用してサンプル率が計算されます。たとえば、検査担当者が1箱に入っているタオルの欠陥数を検査するとします。裂け目が1か所、糸のほつれが2か所(合計3つの欠陥)など、一枚のタオルに複数の欠陥が見つかる場合があります。1箱には10枚のタオルが入っています。検査担当者は、全部で50箱サンプリングし、合計122か所の欠陥を見つけました。
  • 検出担当者は、122か所の欠陥を見つけたので、出現総数は122です。
  • また、検査担当者が抽出したサンプルは50箱なので、サンプルサイズ(N)は50です。
  • タオル1枚あたりの欠陥数を算定するため、検査担当者は、各箱に入っているタオルが10枚であることから、観測の長さとして10を使用します。また1箱あたりの欠陥数を算定するため、検査担当者は観測の長さとして1を使用します。
  • サンプル率は、(出現総数 / N) / (観測の長さ) = (112/50) / 10 = 0.224です。よって、1枚当たりの平均欠陥数は0.244になります。

解釈

事象のサンプル率はその事象の母集団率の推定値です。

サンプル率は母集団全体ではなくサンプルデータに基づくため、サンプル率が母集団出現率に一致する可能性は低いと言えます。より良好に母集団出現率を推定するためには、信頼区間を使用します。

サンプル平均

観測された長さが1とは異なる場合、サンプル平均が表示されます。サンプル平均は、出現総数をサンプルサイズで割った値です。ただし、観測の長さが1とは異なるため、特定の状況においては通常のサンプル率の方が有効です。

信頼区間(CI)と限界

信頼区間は、母集団率の値が含まれる可能性が高い範囲です。データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間または限界値の特定の割合に未知の母集団率が含まれることになります。このような率を含む信頼区間や限界値の割合(%)を区間の信頼水準と言います。たとえば、95%の信頼水準は、母集団から100個のサンプルをランダムに採取した場合、そのうちおよそ95個からは母集団率を含む区間が得られると期待することができます。

上限は、母集団率がそれより小さくなる可能性が高い値です。下限は、母集団率がそれより大きくなる可能性が高い値です。

信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルサイズを増加させることを検討します。 詳細は信頼区間の精度を高める方法を参照してください。

記述統計量

N出現総数サンプル率λに対する95%信頼区間
3059819.9333(18.3675, 21.5970)

これらの結果では、1日あたりのクレーム数に対する母集団出現率の推定値は、およそ19.93です。95%の信頼度で、母集団出現率はおよそ18.37から21.6の間に含まれると考えることができます。

Z-値

Z値とは、標準誤差の単位で観測統計量とその仮説母集団パラメータの差を測定するZ検定の統計量です。

MinitabでZ値を計算する方法として選択 正規近似 する必要があります。

解釈

Z値を標準正規分布の棄却限界値と比較して、帰無仮説を棄却するかどうかを判断できます。ただし通常は、検定のp値を使用して判断する方が、より実用的で便利です。

帰無仮説を棄却するかどうかを判断するには、Z値を棄却限界値と比較します。臨界値は、両側検定ではZ1-α/2 、片側検定ではZ1-α です。両側検定においては、Z値の絶対値が棄却限界値よりも大きい場合、帰無仮説を棄却します。そうでない場合、帰無仮説を棄却できません。Minitabで棄却限界値を計算することも、ほとんどの統計に関する書籍に掲載されている標準正規表で棄却限界値を見つけることもできます。詳細は、逆累積分布関数(ICDF)の使用に進み、「逆累積分布関数で棄却限界値を計算する」をクリックします。

Z値はp値の計算に使用されます。

p値

p値は帰無仮説を棄却するための証拠を測定する確率です。p値が小さいほど、帰無仮説を棄却するための強力な証拠となります。

解釈

p値を使用して、母集団率が仮説率と統計的に異なるかどうかを判断します。

母集団率と仮説率の差が統計的に有意かどうかを判断するには、p値を有意水準と比較します。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。有意水準が0.05の場合は、実際には差がないのに差が存在すると結論付けるリスクが5%あることを示します。
p値 ≤ α: 割合間の差は統計的に有意です(H0を棄却する)
p値が有意水準以下の場合は、帰無仮説を棄却する決定を下します。母集団率と仮説率の差は統計的に有意であると結論付けることができます。専門知識に基づいて、差が実際に有意かどうかを判断します。詳細は、統計的有意性と実質的有意性を参照してください。
p値 > α: 割合の間の差は統計的に有意ではありません(H0を棄却しない)
p値が有意水準よりも大きい場合は、帰無仮説を棄却しない決定を下します。母集団率と仮説率の差は統計的に有意であると結論付けるだけの十分な証拠はありません。検定の検出力が、実質的に有意な差を検出するのに十分であることを確認してください。詳細は、1サンプルポアソン率の検出力とサンプルサイズを参照してください。