差とは、推定する母集団率間の未知な差です。Minitabは、どの母集団率をもう一方の母集団率から引くかを示します。
ポアソン工程では、時間、領域、量、項目数など指定された観察範囲における特定の事象の発生数を数えます。観測の長さは、各観測範囲の規模、期間、またはサイズを表します。
Minitabでは、観測の長さを使用してサンプル率が最適な形式に変換されます。
たとえば、サンプルの観測値ごとに1年間の事象数を数える場合は、長さを1に指定すると1年間の出現率を、長さを12に指定すると1か月間の出現率を表します。
出現総数は、サンプル内で出現する事象の出現回数です。
サンプルサイズ(N)は、サンプルに含まれる観測値の総数です。
サンプルサイズは、信頼区間、検定の検出力、および出現率に影響します。
通常、サンプルが大きいほど信頼区間は狭くなります。サンプルサイズが大きい場合は、検定による差の検出力も高くなります。詳細は、検出力とはを参照してください。
事象のサンプル出現率は、サンプル内の観測値の単位長さあたりに出現する事象の平均出現回数です。
各サンプルのサンプル率は、各サンプルの母集団率の推定値です。
観測された長さが1とは異なる場合、サンプル平均が表示されます。サンプル平均は、出現総数をサンプルサイズで割った値です。ただし、観測の長さが1とは異なるため、特定の状況においては通常のサンプル率の方が有効です。
推定差とは、2つのサンプルにおける出現率の差のことです。
差は母集団全体ではなくサンプルデータに基づくため、サンプル差が母集団差に一致する可能性は低いと言えます。より良好に母集団差を推定するためには、差の信頼区間を使用します。
信頼区間は、母集団の差の値が含まれる可能性が高い範囲です。データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間または限界値の特定の割合に未知の母集団差が含まれることになります。このような差を含む信頼区間や限界値の割合(%)を区間の信頼水準と言います。たとえば、95%の信頼水準は、母集団から100個のサンプルをランダムに採取した場合、そのうちおよそ95個からは母集団差を含む区間が得られると期待することができます。
上限は、母集団差がそれより小さくなる可能性が高い値です。下限は、母集団差がそれより大きくなる可能性が高い値です。
信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。 詳細は、信頼区間の精度を高める方法を参照してください。
差を推定 | 差に対する95%信頼区間 |
---|---|
-7.7 | (-14.6768, -0.723175) |
これらの結果では、2つの郵便局に来局する客数の差の母集団出現率の推定値は-7.7です。95%の信頼度で、母比率の差はおよそ-14.7から-0.7の間に含まれると考えることができます。
出力では、帰無仮説と対立仮説により、検定差として正しい値を入力したことを検証できます。
Z値とは、標準誤差の単位で観測統計量とその仮説母集団パラメータの差を測定するZ検定の統計量です。
Z値を標準正規分布の棄却限界値と比較して、帰無仮説を棄却するかどうかを判断できます。ただし通常は、検定のp値を使用して同じ決定を下すほうがより実用的で便利です。
帰無仮説を棄却するかどうかを判断するには、Z値を棄却限界値と比較します。棄却限界値は、両側検定の場合はZ1-α/2、片側検定の場合はZ1-αです。両側検定においては、Z値の絶対値が棄却限界値よりも大きい場合、帰無仮説を棄却します。Z値の絶対値が棄却限界値よりも小さい場合、帰無仮説を棄却することはできません。Minitabで棄却限界値を計算することも、ほとんどの統計に関する書籍に掲載されている標準正規表で棄却限界値を見つけることもできます。詳細は、逆累積分布関数(ICDF)の使用に進み、「ICDFを使用して重要な値を計算」をクリックします。
p値は帰無仮説を棄却するための証拠を測定する確率です。p値が小さいほど、帰無仮説を棄却するための強力な証拠となります。
p値を使用して、母集団の出現率の差が統計的に有意かどうかを判断します。
仮説差が0の場合、Minitabでは正確検定の手順で帰無仮説を検定します。正確検定のp値は、この正確検定の手順の結果です。もう一方のp値は、正規近似に基づいており、発生総数が少ない場合には不正確になる可能性があります。