2サンプルの比率のすべての統計量を解釈する

2サンプルの比率検定で使用されるすべての統計量の定義と解釈について解説します。

差: p1 – p2

差とは、推定する母集団比率間の未知な差です。Minitabは、どの母集団比率をもう一方の母集団比率から引くかを示します。

N

サンプルサイズ(N)は、サンプルに含まれる観測値の合計数です。

解釈

サンプルサイズは、信頼区間と検定の検出力に影響します。

通常、サンプルサイズが大きいほど信頼区間が狭くなります。また、サンプルサイズが大きいほど、検定での差の検出力が高くなります。詳細は、検出力とはを参照してください。

事象

事象は成功を表す標本の値です。Minitabでは、母比率の推定値である標本比率を計算するために事象数が使用されます。値の順序を変えて、事象として使用される値を変更することができます。詳細は、Minitab出力でのテキスト値の表示順序の変更を参照してください。

サンプルp

サンプル比率は、事象の数をサンプルサイズ(N)で除算した値と等しくなります。

解釈

各サンプルの比率は、各サンプルの母比率の推定値です。

差は、2つのサンプルの比率間の差です。

差は母集団全体ではなくサンプルデータに基づくため、サンプル差が母集団差に一致する可能性は低いと言えます。より良好に母集団差を推定するためには、差の信頼区間を使用します。

信頼区間(CI)と限界

信頼区間は、母集団の差の値が含まれる可能性が高い範囲です。データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間または限界値の特定の割合に未知の母集団差が含まれることになります。このような差を含む信頼区間や限界値の割合(%)を区間の信頼水準と言います。たとえば、95%の信頼水準は、母集団から100個のサンプルをランダムに採取した場合、そのうちおよそ95個からは母集団差を含む区間が得られると期待することができます。

上限は、母集団差がそれより小さくなる可能性が高い値です。下限は、母集団差がそれより大きくなる可能性が高い値です。

信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。 詳細は、信頼区間の精度を高める方法を参照してください。

差の推定

差に対する95%信頼区間
0.0992147(0.063671, 0.134759)
正規近似に基づく信頼区間

これらの結果では、夏季の男子学生と女性学生の雇用率の母集団推定差は0、およそ0.099です。95%の信頼度で、母集団標準偏差での比はおよそ0.06から0.13の間に含まれると考えることができます。

帰無仮説と対立仮説

帰無仮説と対立仮説は、ある母集団についての相互に排他的な2つの仮説です。仮説検定手法では、サンプルデータを用いて帰無仮説を棄却するかどうかを判断します。
帰無仮説
帰無仮説では母集団パラメータ(平均や標準偏差など)は仮説値に等しいと仮定します。帰無仮説とは多くの場合、前回の分析や専門知識を基にした最初の主張を指します。
対立仮説
対立仮説では、母集団パラメータは帰無仮説の仮説値よりも小さい、大きい、異なると仮定します。対立仮説とは、真であると確信できる、または真であることの証明が期待できる仮説を指します。

出力では、帰無仮説と対立仮説により、検定差として正しい値を入力したことを検証できます。

Z値

Z値とは、標準誤差の単位で観測統計量とその仮説母集団パラメータの差を測定するZ検定の統計量です。

解釈

Z値を標準正規分布の棄却限界値と比較して、帰無仮説を棄却するかどうかを判断できます。ただし通常は、検定のp値を使用して同じ決定を下すほうがより実用的で便利です。

帰無仮説を棄却するかどうかを判断するには、Z値を棄却限界値と比較します。棄却限界値は、両側検定の場合はZ1-α/2、片側検定の場合はZ1-αです。両側検定においては、Z値の絶対値が棄却限界値よりも大きい場合、帰無仮説を棄却します。Z値の絶対値が棄却限界値よりも小さい場合、帰無仮説を棄却することはできません。Minitabで棄却限界値を計算することも、ほとんどの統計に関する書籍に掲載されている標準正規表で棄却限界値を見つけることもできます。詳細は、逆累積分布関数(ICDF)の使用に進み、「ICDFを使用して重要な値を計算」をクリックします。

Z値はp値の計算に使用されます。

p値

p値は帰無仮説を棄却するための証拠を測定する確率です。p値が小さいほど、帰無仮説を棄却するための強力な証拠となります。

解釈

p値を使用して、母比率間の差が統計的に有意かどうかを判断します。

母比率間の差が統計的に有意かどうかを判断するには、p値を有意水準と比較します。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。有意水準が0.05の場合は、実際には差がないのに差が存在すると結論付けるリスクが5%あることを示します。
p値 ≤ α: 比率間の差は統計的に有意です(H0を棄却する)
p値が有意水準以下の場合は、帰無仮説を棄却する決定を下します。母比率間の差は仮説差と等しくないと結論付けることができます。仮説差を指定しなかった場合、Minitabでは、比率間に差がないかどうかを検定します(仮説差 = 0)。専門知識に基づいて、差が実際に有意かどうかを判断します。詳細は、統計的有意性と実質的有意性を参照してください。
p値 > α: 比率間の差は統計的に有意ではありません(H0を棄却しない)
p値が有意水準よりも大きい場合は、帰無仮説を棄却しない決定を下します。母比率間の差は統計的に有意であると結論付けるだけの十分な証拠はありません。検定の検出力が、実質的に有意な差を検出するのに十分であることを確認してください。詳細は、2比率の検出力とサンプルサイズを参照してください。

Minitabでは、正規近似法とFisherの正確検定法を使用して、2サンプルの比率検定のp値を計算します。両方のサンプルで事象の数と非事象の数が少なくとも5になっている場合は、2つのp値のうちの小さい方のp値を使用します。どちらかのサンプルで事象の数または非事象の数が5未満になっている場合は、正規近似法の結果が正確ではなくなる可能性があります。Fisherの正確検定法は、すべてのサンプルの場合に有効ですが、保守的になる傾向があります。保守的なp値は、帰無仮説に反する証拠を控えめに示します。