1サンプル平均の無作為化テストの無作為化検定の統計量およびグラフ

1サンプル平均の無作為化検定で使用されるすべての無作為化検定の統計量およびグラフの定義と解釈について解説します。

ヒストグラム

ヒストグラムではサンプル値が多くの区間に分割されており、各区間におけるデータ値の頻度がバーで表されています。

解釈

ヒストグラムを使用して、ブートストラップ分布の形状を調べます。ブートストラップ分布は、各再サンプルの平均分布です。ブートストラップ分布は正規分布のように見えるはずですが、非正規分布のように見える場合は結果を信頼することができません。
50個の再サンプル
1000個の再サンプル

分布は通常、再サンプルの数が増えるほど割り出しやすくなります。たとえば、このデータでは、50個の再サンプルで分布が不明確です。1000個の再サンプルになると、形状はほぼ正規に見えます。

ヒストグラムは仮説検定の結果を視覚的に示します。Minitabでは、再サンプルの中央が仮説平均と同じになるようにデータが調整されます。片側検定では、参照線は元のサンプルの平均値に引かれます。両側検定では、参照線は元のサンプルの平均値に、そして仮説平均の反対側で同じ距離に、引かれます。p値は、参照線の値よりも極端なサンプル平均の比率です。つまり、帰無仮説が真であると仮定した時に、p値は元のサンプルと同じぐらい極端なサンプル平均の比率ということです。平均はヒストグラムの赤になっているところです。

このヒストグラムでは、ブートストラップ分布は正規分布のように見えます。p値が0.2030であることは、サンプル平均の20.3%が元のサンプルの平均以下であるということです。

個別値プロット

個別値プロットはサンプルに対して個別の値を表示します。各円は1つの観測値を表しています。個別値プロットは、観測値の数が比較的少ない場合と、各観測値の効果も評価する必要がある場合に、特に有効です。

Minitabでは、1つのサンプルを取る場合にのみ、個別値プロットが表示されます。元のデータと再サンプルデータの両方が表示されます。

解釈

Minitabでは、再サンプルの中央が仮説平均と同じになるようにデータが調整されます。まず、仮説平均と元のサンプルの平均の差が計算されます。次に、元のサンプルの各値に差を足すかまたは元のサンプルから差を引きます。再サンプルはこの調整済みデータから採取されます。

個別値プロットを使用して、元のサンプルと無作為化サンプルを比較します。無作為化サンプルは、母平均が仮説値(帰無仮説は真)に等しかった場合に無作為サンプルがどのように見えるかを表します。2つのサンプルの中央の差が大きいほど、帰無仮説に対して期待する証拠が増えます。
サンプル平均は仮説平均に等しい
サンプル平均2標準偏差は仮説平均より小さい

帰無仮説と対立仮説

帰無仮説と対立仮説は、ある母集団についての相互に排他的な2つの仮説です。仮説検定手法では、サンプルデータを用いて帰無仮説を棄却するかどうかを判断します。
帰無仮説
帰無仮説では母集団パラメータ(平均や標準偏差など)は仮説値に等しいと仮定します。帰無仮説とは多くの場合、前回の分析や専門知識を基にした最初の主張を指します。
対立仮説
対立仮説では、母集団パラメータは帰無仮説の仮説値よりも小さい、大きい、異なると仮定します。対立仮説とは、真であると確信できる、または真であることの証明が期待できる仮説を指します。

解釈

出力では、帰無仮説と対立仮説により、仮説平均として正しい値を入力したことを検証できます。

観測サンプル

変数N平均標準偏差分散最小中央値最大
時間1611.3313.1159.702181.3007.70010.05016.000

ランダム化検定

帰無仮説H₀: μ = 12
対立仮説H₁: μ < 12
リサンプル数平均標準偏差p値
100011.97830.76250.199

これらの結果において、帰無仮説は、母平均が12になるというものです。対立仮説は、その平均値が12未満になるというものです。

再標本数

再標本数は、Minitabで元のデータセットから無作為に復元標本が採られる回数です。通常は、再標本の数が多いとうまくいきます。

Minitabでは、再標本の中央が仮説平均と同じになるようにデータが調整されます。まず、仮説平均と元の標本の平均の差が計算されます。次に、元の標本の各値に差を足すかまたは元の標本から差を引きます。再標本はこの調整済みデータから採取されます。各再標本の標本の大きさは、元のデータセットの標本の大きさに等しいです。再標本の数は、ヒストグラムの観測数に等しいです。

平均

平均は、ブートストラップ標本の平均すべての和を再標本数で割ったものです。Minitabでは、再標本の中央が仮説平均と同じになるようにデータが調整されます。

解釈

Minitabでは、観測サンプルの平均値とブートストラップ分布の平均値の2つの平均値が表示されます。観測サンプルの平均は、母平均の推定値です。ブートストラップ分布の平均は通常、仮説平均に近いです。2つの値の差が大きいほど、帰無仮説に対して期待する証拠が増えます。

標準偏差(ブートストラップサンプル)

標準偏差とは、散布度、つまり平均を中心としたデータの広がり方を表す最も一般的な測度です。記号σ(シグマ)は、母集団の標準偏差を示す場合によく使用されますが、sは標本の標準偏差を示す場合にも使用されます。多くの場合、工程に対してランダム(自然)な変動は雑音と呼ばれます。標準偏差の単位はデータの単位と同じであるため、通常は、分散よりも解釈が簡単です。

ブートストラップ標本の標本標準偏差(ブートストラップ標準誤差とも)は、平均のサンプル分布標準偏差の推定値です。ブートストラップ標準誤差は標本平均の変動であるため、観測標本の標準偏差は個々の観測値の変動であるのに対して、ブートストラップ標準誤差は小さいです。

解釈

標準偏差を使用して、ブートストラップ標本の平均が全体平均からどのように広がるかを判定します。標準偏差の値が高いほど、平均の広がりが大きいことを示します。正規分布の経験則によれば、値のおよそ68%が全体平均の1つの標準偏差の範囲内にあり、値の95%が2つの標準偏差の範囲内にあり、値の99.7%が3つの標準偏差の範囲内にあります。

ブートストラップ標本の標準偏差を使用して、ブートストラップ平均の精度を推定します。値が小さいほど、精度が高いことを示します。通常、元の標本の標準偏差が大きいと、ブートストラップの標準誤差が大きくなり、仮説検定が弱くなります。また通常、標本の大きさが小さいと、ブートストラップの標準誤差が大きくなり、仮説検定は弱くなります。

標準偏差を使用して、工程の全体的な変動を推定するためのベンチマークを設定することもできます。
病院1
病院2
退院時間

管理者が、2つの病院の救急部門で処置を受けた患者の退院時間を追跡するとします。平均退院時間はほぼ同じ(35分)ですが、標準偏差には有意差があります。病院1の標準偏差はおよそ6です。平均すると、患者の退院時間は平均(点線)から約6分離れています。病院2の標準偏差はおよそ20です。平均すると、患者の退院時間は平均(点線)から約20分離れることになります。

p値

p値は、帰無仮説が真であると仮定する時、元の標本と同じぐらい極端な標本平均の比率です。p値が小さいほど、帰無仮説を棄却するための強力な証拠となります。

解釈

p値を使用して、母平均が仮説平均と統計的に異なるかどうかを判断します。

母平均と仮説平均の差が統計的に有意かどうかを判断するには、p値を有意水準と比較します。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には差が存在しない場合に、差が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:平均値の間の差は統計的に有意です(H0を棄却する)
p値が有意水準以下の場合は、帰無仮説を棄却する決定を下します。母平均と仮説平均の差は統計的に有意であると結論付けられます。信頼区間を計算して差が実質的に有意であるかどうかを判断するには、1サンプル関数のブートストラッピングを使用します。詳細は、統計的有意性と実際的有意性を参照してください。
p値 > α:平均値の間の差は統計的に有意ではありません(H0を棄却しない)
p値が有意水準よりも大きい場合は、帰無仮説を棄却しない決定を下します。母平均と仮説平均の差は統計的に有意であると結論付けるだけの十分な証拠はありません。