1サンプル比率の無作為化テストのすべての統計量およびグラフ

1標本比率の無作為化検定で使用されるすべての統計量とグラフの定義と解釈について解説します。

ヒストグラム

ヒストグラムではサンプル値が多くの区間に分割されており、各区間におけるデータ値の頻度がバーで表されています。

解釈

ヒストグラムを使用して、ブートストラップ分布の形状を調べます。ブートストラップ分布は各再標本の平均分布です。ブートストラップ分布は、正規分布のように見えるべきです。ブートストラップ分布が非正規である場合、結果を信頼することはできません。
50個の再標本
1000個の再標本

分布は通常、再標本数が多いほど割り出しやすくなります。たとえば、このデータでは、50個の再標本で分布が不明確です。1000個の再標本になると、形状はほぼ正規に見えます。

ヒストグラムは仮説検定の結果を視覚的に示します。Minitabでは、再サンプルの中央が仮説平均と同じになるようにデータが調整されます。片側検定では、参照線は元のサンプルの平均値に引かれます。両側検定では、参照線は元のサンプルの平均値に、そして仮説平均の反対側で同じ距離に、引かれます。p値は、参照線の値よりも極端なサンプル平均の比率です。つまり、帰無仮説が真であると仮定した時に、p値は元のサンプルと同じぐらい極端なサンプル平均の比率ということです。平均はヒストグラムの赤になっているところです。

このヒストグラムでは、ブートストラップ分布は正規分布のように見えます。p値0.002は、標本比率の0.2%が元の標本比率より大きいということです。

棒グラフ

棒グラフは、カテゴリごとの発生比率を示します。

Minitabでは、1つの再標本を取る場合にのみ、棒グラフが表示されます。元のデータと再標本データの両方が表示されます。

解釈

棒グラフを使用して、元のサンプルと無作為化サンプルを比較します。無作為化サンプルは、母平均が仮説値(帰無仮説は真)に等しかった場合に無作為サンプルがどのように見えるかを表します。2つのサンプルの中央の差が大きいほど、帰無仮説に対して期待する証拠が増えます。
標本比率は仮説比率と等しい
標本比率は仮説比率より20%小さい

比率

標本比率は、事象の数を標本サイズ(N)で除算した値と等しくなります。

解釈

Minitabでは、観測標本の比率とブートストラップ分布の比率の、2つの異なる比率の値が表示されます(平均)。観測標本の比率は、母比率の推定値です。ブートストラップ分布の比率は通常、仮説比率に近いです。2つの値の差が大きいほど、帰無仮説に対して期待する証拠が増えます。

帰無仮説と対立仮説

帰無仮説と対立仮説は、ある母集団についての相互に排他的な2つの仮説です。仮説検定手法では、サンプルデータを用いて帰無仮説を棄却するかどうかを判断します。
帰無仮説
帰無仮説では母集団パラメータ(平均や標準偏差など)は仮説値に等しいと仮定します。帰無仮説とは多くの場合、前回の分析や専門知識を基にした最初の主張を指します。
対立仮説
対立仮説では、母集団パラメータは帰無仮説の仮説値よりも小さい、大きい、異なると仮定します。対立仮説とは、真であると確信できる、または真であることの証明が期待できる仮説を指します。

解釈

出力では、帰無仮説と対立仮説により、仮説比率として正しい値を入力したことを検証できます。

観測サンプル

N比率
2000.620000

ランダム化検定

帰無仮説H₀: p = 0.5
対立仮説H₁: p > 0.5
リサンプル数群平均p値
10000.499420.002

これらの結果において、帰無仮説は、母比率が0.5になるというものです。対立仮説では、比率は0.5以上になるというものです。

再標本数

再標本数は、Minitabで元のデータセットから無作為に復元標本が採られる回数です。通常は、再標本の数が多いと、うまくいきます。

Minitabでは、再標本の中央が仮説比率と同じになるようにデータが調整されます。各再標本の標本の大きさは、元のデータセットの標本の大きさに等しいです。再標本の数は、ヒストグラムの観測数に等しいです。

平均

平均は、ブートストラップ標本の比率の和を再標本数で割ったものです。Minitabでは、再標本の中央が仮説比率と同じになるようにデータが調整されます。

解釈

Minitabでは、観測サンプルの比率とブートストラップ分布の比率の、2つの異なる比率の値が表示されます(平均)。観測標本の比率は、母比率の推定値です。ブートストラップ分布の比率は通常、仮説比率に近いです。2つの値の差が大きいほど、帰無仮説に対して期待する証拠が増えます。

p値

p値は、帰無仮説が真であると仮定する時、元の標本と同じぐらい極端な標本比率の比率です。p値が小さいほど、帰無仮説を棄却するための強力な証拠となります。

解釈

p値を使用して、母比率が仮説比率と統計的に異なるかどうかを判断します。

母比率と仮説比率の差が統計的に有意かどうかを判断するには、p値を有意水準と比較します。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には差が存在しない場合に、差が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:比率間の差は統計的に有意です(H0を棄却する)
p値が有意水準以下の場合は、帰無仮説を棄却する決定を下します。母比率と仮説比率の差は統計的に有意であると結論付けられます。信頼区間を計算して差が実質的に有意であるかどうかを判断するには、1サンプル関数のブートストラッピングを使用します。詳細は、統計的有意性と実際的有意性を参照してください。
p値 > α:比率間の差は統計的に有意ではありません(H0を棄却しない)
p値が有意水準よりも大きい場合は、帰無仮説を棄却しない決定を下します。母比率と仮説比率の差は統計的に有意であると結論付けるだけの十分な証拠はありません。