1サンプルの分散のすべての統計量を解釈する

1サンプルの分散分析で使用されるすべての統計量の定義と解釈について解説します。

帰無仮説と対立仮説

帰無仮説と対立仮説は、ある母集団についての相互に排他的な2つの仮説です。仮説検定手法では、サンプルデータを用いて帰無仮説を棄却するかどうかを判断します。
帰無仮説
帰無仮説では母集団パラメータ(平均や標準偏差など)は仮説値に等しいと仮定します。帰無仮説とは多くの場合、前回の分析や専門知識を基にした最初の主張を指します。
対立仮説
対立仮説では、母集団パラメータは帰無仮説の仮説値よりも小さい、大きい、異なると仮定します。対立仮説とは、真であると確信できる、または真であることの証明が期待できる仮説を指します。

解釈

出力では、帰無仮説と対立仮説により、仮説標準偏差または仮説分散として正しい値を入力したことを検証できます。

N

サンプルサイズ(N)は、サンプルに含まれる観測値の合計数です。

解釈

サンプルサイズは、信頼区間と検定の検出力に影響します。

通常、サンプルサイズが大きいほど信頼区間が狭くなります。また、サンプルサイズが大きいほど、検定での差の検出力が高くなります。詳細は、検出力とはを参照してください。

標準偏差

標準偏差とは、散布度、つまり平均を中心としたデータの広がり方を表す最も一般的な測度です。記号σ(シグマ)は、母集団の標準偏差を示す場合によく使用されますが、sはサンプルの標準偏差を示す場合にも使用されます。多くの場合、工程に対してランダム(自然)な変動は雑音と呼ばれます。

標準偏差は、データと同じ単位を使用します。

解釈

サンプルデータの標準偏差は、母集団標準偏差の推定値です。

標準偏差は母集団全体ではなくサンプルデータに基づくため、サンプル標準偏差が母集団標準偏差に一致する可能性は低いと言えます。より良好に母集団標準偏差を推定するためには、信頼区間を使用します。

標準偏差を使用して、工程の全体的な変動を推定するためのベンチマークを設定することもできます。
病院1
病院2
退院時間

管理者が、2つの病院の救急部門で処置を受けた患者の退院時間を追跡するとします。平均退院時間はほぼ同じ(35分)ですが、標準偏差には有意差があります。病院1の標準偏差はおよそ6です。平均すると、患者の退院時間は平均(点線)から約6分離れています。病院2の標準偏差はおよそ20です。平均すると、患者の退院時間は平均(点線)から約20分離れることになります。

分散

分散は、平均を中心としたデータの広がりを測定します。分散は標準偏差の二乗に等しくなります。

解釈

サンプルデータの分散は、母分散の推定値です。

分散は母集団全体ではなくサンプルデータに基づくため、サンプル分散が母分散に一致する可能性は低いと言えます。より良好に母分散を推定するためには、信頼区間を使用します。

信頼区間(CI)と限界

信頼区間は、母集団標準偏差または母分散の値が含まれる可能性が高い範囲です。データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間または限界値の特定の割合に未知の母集団標準偏差または母分散が含まれることになります。このような標準偏差や分散を含む信頼区間や限界値の割合(%)を区間の信頼水準と言います。たとえば、95%の信頼水準は、母集団から100個のサンプルをランダムに採取した場合、そのうちおよそ95個からは母集団標準偏差または母分散を含む区間が得られると期待することができます。

上限は、母集団標準偏差または母分散がそれより小さくなる可能性が高い値です。下限は、母集団標準偏差または母分散がそれより大きくなる可能性が高い値です。

信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。 詳細は、信頼区間の精度を高める方法を参照してください。

データが含まれる列を入力すると、標準偏差の信頼区間しか算出されません。

Minitabでは2つの信頼区間が表示されます。通常はボネット(Bonett)の方法を使用します。カイ二乗法は、データが正規分布に従うことが確かな場合にのみ使用してください。正規性からのわずかな偏差があってもカイ二乗法の結果に大きく影響する可能性があるためです。カイ二乗法は、実際上の帰結なしに正規性を理論上仮定できる、教育目的で使用されます。

Minitabでは、要約データを使用してボネット(Bonett)の方法で計算を行うことはできません。

記述統計量

N標準偏差分散Bonettを使用したσに対する
95%信頼区間
カイ二乗を使用したσに対する
95%信頼区間
500.8710.759(0.704, 1.121)(0.728, 1.085)

これらの結果では、梁の長さの母集団標準偏差の推定値は0.871で、母分散の推定値は0.759です。正規性検定においてデータはパスしなかったので、ボネットの方法を使用します。95%の信頼度で、母集団標準偏差は0.704から1.121の間に含まれると考えることができます。

検定統計量

検定統計量は、観測された分散比とその仮説分散を測定するカイ二乗検定の統計量です。

解釈

検定統計量をカイ二乗分布の棄却限界値と比較して、帰無仮説を棄却するかどうかを判断できます。ただし通常は、検定のp値を使用して同じ決定を下すほうがより実用的で便利です。p値はすべてのサイズ検定で同じ意味になりますが、サンプルサイズによっては同じカイ二乗統計量で反対の結論を示すこともできます。

帰無仮説を棄却するかどうかを判断するには、検定統計量を棄却限界値と比較します。Minitabで棄却限界値を計算することも、ほとんどの統計に関する書籍に掲載されているカイ二乗表で棄却限界値を見つけることもできます。詳細は、逆累積分布関数(ICDF)の使用に進み、「ICDFを使用して重要な値を計算」をクリックします。
  • 両側検定の場合、棄却限界値は および. 検定統計量が最初の値より小さい、または2番目の値より大きい場合、帰無仮説を棄却します。値が中間の場合、帰無仮説を棄却することはできません。
  • 「次より小さい」対立仮説の片側検定の場合、棄却限界値は. 検定統計量がこの値より小さい場合、帰無仮説を棄却します。Z値の絶対値が棄却値より大きい場合、帰無仮説を棄却します。
  • 「次より大きい」片側検定の場合、棄却限界値は. 検定統計量がこの値より大きい場合、帰無仮説を棄却します。Z値の絶対値が棄却値より大きい場合、帰無仮説を棄却します。

検定統計量はp値を計算するために使用されます。ボネット(Bonnet)の方法では検定統計量は無いため、p値の計算には信頼限界で定義される棄却域が使用されます。

自由度

自由度(DF)は、未知のパラメータの値を推定し、その推定値の変動性を計算するためにデータで使用できる情報量を示します。1サンプルの分散検定では、自由度はサンプルに含まれる観測値の数によって決まります。

解釈

Minitabは、自由度を使用して検定統計量を判断します。自由度はサンプルサイズによって決まります。サンプルサイズを大きくすると、母集団に関して提供される情報が増え、自由度が高くなります。

p値

p値は帰無仮説を棄却するための証拠を測定する確率です。p値が小さいほど、帰無仮説を棄却するための強力な証拠となります。

解釈

p値を使用して、母分散または母標準偏差が仮説分散または仮説標準偏差と統計的に異なるかどうかを判断します。

母分散または母標準偏差と仮説値の差が統計的に有意かどうかを判断するには、p値を有意水準と比較します。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。有意水準が0.05の場合は、実際には差がないのに差が存在すると結論付けるリスクが5%あることを示します。
p値 ≤ α: 分散または標準偏差の間の差は統計的に有意です(H0を棄却する)
p値が有意水準以下の場合は、帰無仮説を棄却する決定を下します。母分散間または母標準偏差間の差は統計的に有意であると結論付けることができます。専門知識に基づいて、差が実際に有意かどうかを判断します。詳細は、統計的有意性と実質的有意性を参照してください。
p値 > α: 分散または標準偏の間の差は統計的に有意ではありません(H0を棄却しない)
p値が有意水準よりも大きい場合は、帰無仮説を棄却しない決定を下します。母分散または母標準偏差と仮説分散または仮説標準偏差の間の差は統計的に有意であると結論付けるだけの十分な証拠はありません。検定の検出力が、実質的に有意な差を検出するのに十分であることを確認してください。詳細は、1分散の検出力とサンプルサイズを参照してください。
Minitabには2つのp値が表示されます。通常は、Bonettの方法を使用します。カイ二乗法は、データが正規分布に従うことが確かな場合にのみ使用します。これは、正規性からの偏差があると、それがわずかであってもカイ二乗法の結果に大きく影響する可能性があるからです。カイ二乗法は教習目的で用意されており、実際的な結果なしに正規性を理論上仮定することができます。

要約データを使用する場合は、Bonettの方法でp値を計算することはできません。