サンプルサイズ(N)は、各グループに含まれる観測値の合計数です。
サンプルサイズは信頼区間と検出力に影響します。
通常、サンプルが大きいと信頼区間は狭くなり、差の検出力も高くなります。
各グループにおける観測値の平均です。平均とはデータの中心値を確認できる単一の値で、各グループを表しています。各グループを示す単一の値です。これはグループのすべての観測値の和をそのグループの観測値数で割ったものです。
各サンプルの平均値は、各母平均の推定値です。サンプルの平均値の差は母平均の差の推定値です。
グループ平均の差は母集団全体ではなくサンプルデータに基づいているため、必ずしも母集団の差に等しいとは言い切れません。母集団の差についてより理解するには、信頼区間を使用してください。
標準偏差とは、散布度、つまり平均からのデータの広がり方を表す最も一般的な測度です。多くの場合、母集団の標準偏差を表すには記号σ(シグマ)が使用されます。サンプルの標準偏差を表すには記号sが使用されます。
グループのサンプル標準偏差は、そのグループにおける母集団の標準偏差の推定値です。標準偏差は、信頼区間とp値を計算するために使用します。サンプル標準偏差が大きいほど、信頼区間は低く(広く)なり、検出力も低くなります。
分散分析では、すべての水準の母集団標準偏差が同じであると仮定されます。等分散を仮定できない場合、一元配置分散分析のオプション、Wlech検定の分散分析を使用します。
これらの信頼区間は、母集団の真の平均を含む可能性が高い値の幅です。信頼区間は併合標準偏差を使用し算出されます。
データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。
信頼区間を使用して、各グループの母集団中央値の推定値を評価します。
たとえば、信頼水準が95%の場合は、信頼区間にグループの平均が含まれることを95%信頼できます。信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。
塗料 | N | 平均 | 標準偏差 | 95%信頼区間 |
---|---|---|---|---|
配合 1 | 6 | 14.73 | 3.36 | (11.37, 18.10) |
配合 2 | 6 | 8.57 | 5.50 | (5.20, 11.93) |
配合 3 | 6 | 12.98 | 3.73 | (9.62, 16.35) |
配合 4 | 6 | 18.07 | 2.64 | (14.70, 21.43) |
この結果には、各配合には平均硬度の信頼区間を有しています。このデータを多重比較した結果、配合4の硬度が配合2の硬度よりも有意に高いことがわかります。配合2より配合4の硬度が高いというだけでは、配合4が使用目的に応じた十分な硬度があるとは限りません。配合4が十分な硬度か否かを判断するには、グループ平均の信頼区間がのほうが有効です。
併合標準偏差とは、すべての水準の共通標準偏差の推定値です。併合標準偏差は、グループ平均(全体の平均ではない)を中心とした全データ点の標準偏差です。グループの大きさは併合標準偏差の全体的な推定値に比例的に影響します。
標準偏差の値が高いほど、データの広がりが大きいことを示します。値を大きくすると、より精度の低い(広い)信頼区間となり、検出力が低くなります。
Minitabは、併合標準偏差を用いてグループ平均とグループ平均間の差両方に対し、信頼区間を求めます。
グループ | 平均 | 標準偏差 | N |
---|---|---|---|
1 | 9.7 | 2.5 | 50 |
2 | 12.1 | 2.9 | 50 |
3 | 14.5 | 3.2 | 50 |
4 | 17.3 | 6.8 | 200 |
はじめの3つのグループは、標準偏差がおよそ3でサイズ(n=50)が等しくなっています。4番目のグループは非常に大きく(n=200)、より高い標準偏差(6.8)になっています。併合標準偏差は重み付き平均を使用するため、併合標準偏差の値(5.488)は最大グループの標準偏差に近くなっています。