帰無仮説と対立仮説を使用して、同等性基準が正しいことと、適切な検定対象の対立仮説を選択していることを検証します。
帰無仮説: | 差 ≤ -0.5 または 差 ≥ 0.5 |
---|---|
対立仮説: | -0.5 < 差 < 0.5 |
α水準: | 0.05 |
帰無仮説 | 自由度 | t値 | p値 |
---|---|---|---|
差 ≤ -0.5 | 12 | 1.8637 | 0.044 |
差 ≥ 0.5 | 12 | -3.0566 | 0.005 |
この結果で、Minitabは検定母集団の平均と参照母集団の平均の差に関する2つの帰無仮説を検定します。1)母平均間の差は下側同等性限界の−0.5以下である。2)母平均間の差は上側同等性限界の0.5以上である。対立仮説は、母平均間の差は下側同等性限界と上側同等性限界の間である(つまり、検定母集団の平均は参照母集団の平均と同等である)、となります。
有意水準(アルファまたはαで示される)とは、帰無仮説が正しいにもかかわらず帰無仮説を棄却するリスク(第一種過誤)の最大許容水準です。たとえば、デフォルトの仮説を使用して同等性検定を実行する場合、0.05のαは実際には正しくないにもかかわらず同等性を主張するリスクが5%あることを示しています。
同等性検定のα水準によって、信頼区間の信頼水準も決定されます。デフォルトでは、信頼水準は(1 – α) x 100%です。信頼区間の代替計算方法を使用した場合、信頼水準は(1 – 2α) x 100%です。
α(アルファ)水準を使用し、帰無仮説(H0)を棄却するかどうかを決定します。
p値がα水準未満の場合、H0を棄却して、結果が統計的に有意であると主張できます。
自由度とは、未知のパラメータの値を推定して推定値の変動性を計算するために利用することが可能なデータの情報量のことです。
等分散を仮定しない場合、2サンプル同等性検定の自由度はサンプルの標準偏差とサイズによって決まります。等分散を仮定する場合、合計の自由度はサンプルサイズのみによって決まります(サンプルサイズの合計から2を引いたもの)。
Minitabでは、自由度を使用して検定統計量を計算します。
自由度は、サンプルサイズに影響を受けます。サンプルサイズを大きくすると、母集団に関して提供される情報が増え、自由度が高くなります。
この検定統計量は、サンプルの変動性に関連して2つの母平均間の差のサイズを評価します。同等性基準が検定平均値と参照平均値の差、または対数変換を使用して検定平均値と参照平均値の比で表現される場合、t値は標準誤差の単位でサンプル参照平均値とサンプル検定平均値の差を測定します。同等性基準が検定平均値と参照平均値の比で表現される場合、t値は両方のサンプルの変動性に関して、サンプル検定平均値と参照平均値の割合の差を測定します。
t値を使用して、帰無仮説を棄却するかどうかを判断できます。ただし、ほとんどの人はp値または信頼区間のほうが解釈が容易であるため、こちらを使用します。
一般に、サンプルの変動性に関して差または比が大きくなるほど、検定のt値の絶対値が大きくなり、帰無仮説に対する証拠が強力になります。
検定ごとに、t値を使ってp値を算出します。
p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。
p値を使用して、検定母集団の平均と参照母集団の平均の差(または比)に次の帰無仮説を棄却するのに十分な根拠があるかどうかを判断します。1)差(または比)は下側同等性限界(非劣等性)より大きい。2)差(または比)は上側同等性限界(非優越性)より小さい。デフォルトでは、同等性検定では、これらの帰無仮説の両方を検定し、検定ごとのp値が含まれます。
それぞれの帰無仮説について、p値を検定の有意水準(アルファまたはαで示される)と比較します。0.05のαが最も一般的です。
同等性検定の結果を視覚的に評価するには、p値の解釈がより簡単な等値プロットの結果を調べます。