1サンプルの比率のすべての統計量を解釈する

1サンプルの比率分析で使用されるすべての統計量の定義と解釈について解説します。

帰無仮説と対立仮説

帰無仮説と対立仮説は、ある母集団についての相互に排他的な2つの仮説です。仮説検定では、サンプルデータを使用して帰無仮説を棄却するかどうかを判断します。
帰無仮説
帰無仮説では母集団パラメータ(平均や標準偏差など)は仮説値に等しいと仮定します。 帰無仮説は、多くの場合、「差なし」または「効果なし」の仮説です。
対立仮説
対立仮説では、母集団パラメータは帰無仮説の仮説値よりも小さい、大きい、異なると仮定します。対立仮説は、帰無仮説の記述に反する真であると疑うことを述べます。多くの場合、仮説検定の目的は、サンプルデータが帰無仮説を棄却するのに十分な証拠を提供することを示すことです。 帰無仮説の棄却は、対立仮説を支持します。

出力では、帰無仮説と対立仮説により、仮説比率として正しい値を入力したことを検証できます。

N

サンプルサイズ(N)は、サンプルに含まれる観測値の合計数です。

解釈

サンプルサイズは、信頼区間と検定の検出力に影響します。

通常、サンプルサイズが大きいほど信頼区間が狭くなります。また、サンプルサイズが大きいほど、検定での差の検出力が高くなります。詳細は、検出力とはを参照してください。

事象

イベントは、サンプルで関心のある値です。Minitabでは、母比率の推定値である標本比率を計算するために事象数が使用されます。Minitabで事象として使用する値は、分析を指定するときに他の値を選択することで変更できます。分析で推定する比率に従って事象を選択します。

サンプルp

標本比率は、事象の数を標本サイズ(N)で除算した値と等しくなります。

解釈

サンプル比率は、対象事象の母比率の推定値です。

比率は母集団全体ではなくサンプルデータに基づくため、サンプルの比率が母比率に一致する可能性は低いと言えます。より良好に母比率を推定するためには、信頼区間を使用します。

信頼区間(CI)と限界

信頼区間は、母比率の値が含まれる可能性が高い範囲です。データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間または限界値の特定の割合に未知の母比率がカバーまれることになります。比率をカバーするこれらの信頼区間または限界値のパーセントが区間の信頼水準です。 たとえば、95%の信頼水準は、母集団から100個のサンプルをランダムに抽出した場合、サンプルのうち約95個が母比率をカバーする区間を生成すると期待できることを示します。

上限は、母比率がそれより小さくなる可能性が高い値です。下限は、母比率がそれより大きくなる可能性が高い値です。

信頼区間により、結果の実質的な有意性を評価しやすくなります。専門知識を使用して、信頼区間に状況に対して実際的に有意な値が含まれているかどうかを判断します。 区間が広すぎて役に立たない場合は、サンプルサイズを増やすことを検討してください。詳細については、信頼区間の精度を高める方法を参照してください。

記述統計量

N事象サンプルppに対する95%信頼区間
1000870.087000(0.070268, 0.106208)

これらの結果では、購入した世帯の推定母比率は0.087です。95%の信頼度で、母比率はおよそ0.07から0.106の間に含まれると考えることができます。

p値

p値は、データのサンプルに含まれる帰無仮説を棄却する証拠を測定する確率です。p値が小さいほど、帰無仮説を棄却するための強力な証拠となります。

解釈

p値を使用して、母比率が仮説比率と統計的に異なるかどうかを判断します。

母比率と仮説比率の差が統計的に有意かどうかを判断するには、p値を有意水準と比較します。通常、0.05の有意水準(αまたはアルファとも呼ばれる)が有効に機能します。0.05の有意水準は、実際には差が存在しない場合に、差が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:比率の間の差は統計的に有意です(H0を棄却する)
p値が有意水準以下の場合は、帰無仮説を棄却する決定を下します。母比率と仮説比率の差は統計的に有意であると結論付けられます。専門知識に基づいて、差が実際に有意かどうかを判断します。詳細については、統計的有意性と実質的有意性を参照してください。
p値 > α:比率の間の差は統計的に有意ではありません(H0を棄却しない)
p値が有意水準よりも大きい場合は、帰無仮説を棄却しない決定を下します。母比率と仮説比率の差は統計的に有意であると結論付けるだけの十分な証拠はありません。検定の検出力が、実質的に有意な差を検出するのに十分であることを確認してください。詳細については、1比率の検出力とサンプルサイズ を参照してください。

Z-値

Z値は、観測されたスコア検定統計量です。この値は、帰無仮説の下での標準誤差の単位で、関心のある事象のサンプル比率と仮説の母集団パラメータ値の差を測定します。帰無仮説の標準誤差は、次の形式になります。
ここで、 p0 は仮説上の母比率、 n は試行回数です。

結果には、連続性補正なしで Wilson-Score を計算に使用した場合の Z 値が含まれます。

解釈

Z値を標準正規分布の棄却限界値と比較して、帰無仮説を棄却するかどうかを判断できます。ただし通常は、検定のp値を使用して判断する方が、より実用的で便利です。

帰無仮説を棄却するかどうかを判断するには、Z値を棄却限界値と比較します。臨界値は、両側検定ではZ1-α/2 、片側検定ではZ1-α です。両側検定においては、Z値の絶対値が棄却限界値よりも大きい場合、帰無仮説を棄却します。そうでない場合、帰無仮説を棄却できません。Minitabで棄却限界値を計算することも、ほとんどの統計に関する書籍に掲載されている標準正規表で棄却限界値を見つけることもできます。詳細は、逆累積分布関数(ICDF)の使用に進み、「逆累積分布関数で棄却限界値を計算する」をクリックします。

Z値はp値の計算に使用されます。