1サンプル同等性検定の検出力とサンプルサイズのすべての統計量およびグラフの解釈

1サンプル同等性検定の検出力とサンプルサイズで使用されるすべての統計量およびグラフの定義と解釈について解説します。

差に対する検出力

出力の最初の行は、同等性検定に対してどのように仮説が指定されているかを示します。

「差に対する検出力」は、検定の母平均と目標値との差(検定平均 - 目標値)に関して仮説が指定されていることを示します。

帰無仮説と対立仮説

帰無仮説と対立仮説は、母集団についての相互に排他的な仮説です。同等性検定では、サンプルデータを使用して帰無仮説を棄却するかどうかを判断します。
帰無仮説
Minitabでは、選択された対立仮説に応じて、以下の帰無仮説の一方または両方を検定します。
  • 母平均と目標値の差は上側同等性限界以上である。
  • 母平均と目標値の差は下側同等性限界以下である。
対立仮説
対立仮説は、以下のいずれかまたは両方です。
  • 母平均と目標値の差は上側同等性限界より小さい。
  • 母平均と目標値の差は下側同等性限界より大きい。

解釈

帰無仮説と対立仮説を使用して、同等性基準が正当で、検定する適切な対立仮説が選択されていることを確認します。

1サンプル同等性検定 方法 差に対する検出力: 検定平均値 - 目標値 帰無仮説: -0.42以下または0.42以上の差 対立仮説: -0.42 < 差 < 0.42 α水準: 0.05 仮定された標準偏差: 0.332

これらの結果において、Minitabでは次の2つの帰無仮説が検定されます。
  • 母平均と目標値の差は下側同等性限界(-0.42)以下である。
  • 母平均と目標値の差は上側同等性限界(0.42)以上である。
対立仮説は、差は下側同等性限界と上側の同等性限界の間である(つまり、母平均は目標値と同等である)、となります。

α(アルファ)

有意水準(アルファまたはαと表されます)は、帰無仮説が真であるときにその帰無仮説を棄却する(タイプIの誤り)のリスクの最大許容水準です。たとえば、デフォルトの仮説を使用して同等性検定を実行する場合、0.05のαは、検定平均と目標値の差が実際には同等性限界内にない場合に同等であると判断するリスクが5%であることを示します。

同等性検定のα水準により、信頼区間に対する信頼水準も決定されます。信頼水準はデフォルトでは1 – αで、信頼区間の計算に代替方法を使用する場合は1 – 2αです。

解釈

有意水準を使用して、帰無仮説(H0)が真の場合の検定の検出力値を最小化します。有意水準の値が高いほど、検定の検出力が高くなりますが、真である帰無仮説を棄却してしまうタイプIの誤りを犯す可能性も高くなります。

仮定された標準偏差

標準偏差とは、散布度、つまり平均に対するデータの変動を表す最も一般的な尺度です。多くの場合、工程に対してランダム(自然)な変動は雑音と呼ばれます。

解釈

仮定された標準偏差とは、検出力分析のために入力する母標準偏差の計画推定値です。Minitabでは、検定の検出力を計算するために、仮定された標準偏差が使用されます。標準偏差の値が高いほど、データの変動が大きいことを示し、検定の検出力は低くなります。

この値は、母平均と目標値との差を表します。

このトピックでの定義および解釈は、デフォルトの対立仮説(下側限界 < 検定平均値 - 目標値 < 上側限界)を使用する標準同等性検定に適用されます。

解釈

サンプルサイズと検定の検出力を入力すると、指定した検出力とサンプルサイズで検定に使用できる差が計算されます。サンプルサイズを大きくするほど、差が同等性限界に近づきます。

サンプルサイズと、指定された検出力において検定で使用できる差の関係をより詳しく調べるには、検出力曲線を使用します。

これらの結果は、サンプルサイズが大きくなるにつれて、指定された検出力水準において使用できる差のサイズがどのように大きくなるかを示しています。

  • 観測値が30個ある場合、差にかかわらず、同等性を示すために検出力0.9を達成することはできません。
  • 観測値が40個ある場合、検定の検出力が0.9以上になるのは、差が約−0.07~0.07のときです。
  • 観測値が60個ある場合、検定の検出力が0.9以上になるのは、差が約−0.14~0.14のときです。
  • 観測値が100個ある場合、検定の検出力が0.9以上になるのは、差が約−0.20~0.20のときです。

Power and Sample Size

1-Sample Equivalence Test Power for difference: Test mean - target Null hypothesis: Difference ≤ -0.42 or Difference ≥ 0.42 Alternative hypothesis: -0.42 < Difference < 0.42 α level: 0.05 Assumed standard deviation: 0.732
Sample Size Power Difference 30 0.9 * 40 0.9 -0.071272 40 0.9 0.071272 60 0.9 -0.140212 60 0.9 0.140212 100 0.9 -0.204306 100 0.9 0.204306

サンプルサイズ

サンプルサイズとは、サンプルに含まれる観測値の合計数のことです。

解釈

サンプルサイズを使用して、同等性定検において、特定の差で特定の検出力値を得るために必要な観測値数を推定します。

検定での差と検出力値を入力すると、必要なサンプルサイズが計算されます。サンプルサイズは整数であるため、検定の実際の検出力は、指定した検出力値よりもわずかに大きくなる場合があります。

サンプルサイズを大きくすると、検定の検出力も高くなります。適切な検出力を達成するには、サンプル内の観測値数が十分である必要があります。しかし、サンプルサイズを大きくしすぎて、不必要なサンプリングに時間と費用を浪費したり、重要でない差が統計的に有意であることを検出することは望ましくありません。

サンプルサイズと、指定された検出力において検定で使用できる差の関係をより詳しく調べるには、検出力曲線を使用します。

検出力とサンプルサイズ

1サンプル同等性検定 方法 差に対する検出力: 検定平均値 - 目標値 帰無仮説: -0.42以下または0.42以上の差 対立仮説: -0.42 < 差 < 0.42 α水準: 0.05 仮定された標準偏差: 0.732
結果 サンプル 目標検 差 サイズ 出力 実際の検出力 0.1 47 0.9 0.903687 0.2 97 0.9 0.902206 0.3 321 0.9 0.900788

これらの結果は、差のサイズが大きくなって同等性限界値に近づくにつれて、指定された検定力を達成するために、より大きなサンプルサイズが必要になることを示しています。差が0.1の場合、検出力0.9を達成するには観測値が47個以上必要です。差が0.3の場合、検出力0.9を達成するには観測値が321個以上必要です。

検出力

このトピックでの定義および解釈は、デフォルトの対立仮説(下側限界 < 検定平均値 - 目標値 < 上側限界)を使用する標準同等性検定に適用されます。

同等性検定の検出力は、差が実際に同等性限界の範囲内にあるときに、検定でそのことを実証する確率のことです。同等性検定の検出力は、サンプルサイズ、差、同等性限界、データの変動性、および検定の有意水準の影響を受けます。

詳細は、同等性検定の検出力を参照してください。

解釈

サンプルサイズと差を入力すると、検定の検出力が計算されます。通常は、0.9が検出力として十分な値と見なされます。値が0.9の場合は、母集団の差が実際に同等性限界の範囲内にあるときに同等性を実証する確率が90%あることを示します。同等性検定の検出力が低い場合は、母平均と目標値が同等であったとしても、その同等性を実証することに失敗する可能性があります。

検定での差と検出力値を入力すると、必要なサンプルサイズが計算されます。Minitabでは、そのサンプルサイズでの検定の実際の検出力も計算します。サンプルサイズは整数であるため、検定の実際の検出力は、指定した検出力値よりもわずかに大きくなる場合があります。

通常、サンプルサイズが小さいほど、または差が同等性限界に近いほど、検定で同等性を主張する検出力が低くなります。

検出力とサンプルサイズ

1サンプル同等性検定 方法 差に対する検出力: 検定平均値 - 目標値 帰無仮説: -0.42以下または0.42以上の差 対立仮説: -0.42 < 差 < 0.42 α水準: 0.05 仮定された標準偏差: 0.732
結果 サンプル 差 サイズ 検出力 0.1 20 0.516387 0.1 35 0.806390 0.2 20 0.341093 0.2 35 0.538352

これらの結果において、差が0.1の場合、検定の検出力はサンプルサイズが20のときにおよそ0.52、サンプルサイズが35のときにおよそ0.81になっています。差が0.2の場合、検出力はサンプルサイズが20のときにおよそ0.34、サンプルサイズが35のときにおよそ0.54になっています。

検出力曲線

この検出力曲線では、検定の検出力に対して平均と目標値の間の差がプロットされます。

解釈

検出力曲線を使用して、検定に適したサンプルサイズと検出力を評価します。

この検出力曲線は、有意水準と標準偏差を一定に保って、各サンプルサイズに対する検出力と差のすべての組み合わせを表します。検出力曲線上の記号は、入力した値に基づいて計算された値を表します。たとえば、サンプルサイズと検出力の値を入力すると、それに対応する差が計算され、計算された値がグラフ上に表示されます。

曲線上の値を調べることにより、特定の検出力値とサンプルサイズにおいて使用できる平均と目標の差を決定できます。通常、検出力の値として0.9は適切であるとされます。ただし、分析者によっては、検出力の値として0.8が適切であると考えることもあります。同等性検定の検出力が低い場合、平均が目標に同等であるにもかかわらず、同等性を示すことができない可能性があります。サンプルサイズを大きくすると、検定の検出力も高くなります。適切な検出力を達成するには、サンプル内の観測値数が十分である必要があります。しかし、サンプルサイズを大きくしすぎて、不必要なサンプリングに時間と費用を浪費したり、統計的に有意な重要でない差を検出することは望ましくありません。通常、差が同等性限界に近くなるほど、同等性を示すために必要な検出力が高くなります。

このグラフでは、サンプルサイズ30の検出力曲線は、どのサイズの差に対しても検定の検出力が0.9に達しないことを示しています。サンプルサイズ40の検出力曲線は、約0.0の差に対して検定の検出力が0.9であることを示しています。サンプルサイズ100の検出力曲線は、約±0.2の差に対して検定の検出力が0.9であることを示しています。各曲線において、差が下側同等性限界または上側同等性限界に近づくにつれて、検定の検出力は低下し、α(アルファ。同等でない場合に同等であるとするリスク)に近づきます。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください