キャリーオーバー統計量は、1つの処理の次回の処理に対する効果を測定します。たとえば、参照処理の効果が強く、検定処理の効果が弱いとします。ウォッシュアウト期間が十分に長くない場合、期間1の参照処理の残留効果によって期間2の検定処理の効果が実際よりも強く見える可能性があります。
キャリーオーバー効果のp値を有意水準(アルファまたはαで示される)と比較します。0.05のαが一般的です。p値がαより低い場合、キャリーオーバー効果は統計的に有意です。その場合、同等性検定の結果に偏りが生じる可能性があります。
効果 | 標準誤差 | 自由度 | t値 | p値 | 95% 同等の CI | |
---|---|---|---|---|---|---|
持ち越し | 0.45181 | 0.64988 | 15 | 0.69521 | 0.498 | (-0.93339, 1.8370) |
処理 | -0.32104 | 0.060641 | 15 | -5.2941 | 0.000 | (-0.45030, -0.19179) |
時期 | -0.097708 | 0.060641 | 15 | -1.6112 | 0.128 | (-0.22696, 0.031546) |
この結果で、推定されるキャリーオーバー効果は0.45181です。しかし、p値は0.498で、α(0.05)より高くなっています。したがって、キャリーオーバー効果は統計的に有意ではありません。
キャリーオーバー効果と期間効果のいずれかが統計的に有意な場合、同等性検定の結果は信頼できない可能性があります。また、処理効果をキャリーオーバー効果や期間効果と混同し、推定値が不確実になるおそれもあります。2x2交差計画を使用する場合は、データを収集して分析する前に、慎重に分析を計画してキャリーオーバー効果と期間効果を回避する必要があります。
処理統計量は、検定処理の効果と参照処理の効果の差を測定します。ほとんどの分析では、処理効果が対象の効果となります。
処理効果のp値を有意水準(アルファまたはαで示されます)と比較します。0.05のαが一般的です。p値がαより低い場合、処理効果は統計的に有意です。
効果 | 標準誤差 | 自由度 | t値 | p値 | 95% 同等の CI | |
---|---|---|---|---|---|---|
持ち越し | 0.45181 | 0.64988 | 15 | 0.69521 | 0.498 | (-0.93339, 1.8370) |
処理 | -0.32104 | 0.060641 | 15 | -5.2941 | 0.000 | (-0.45030, -0.19179) |
時期 | -0.097708 | 0.060641 | 15 | -1.6112 | 0.128 | (-0.22696, 0.031546) |
この結果で、推定される処理効果は−0.32104です。処理効果のp値は0.000で、0.05より低くなっています。したがって、処理効果は0.05水準で統計的に有意です。処理効果が有意な場合、一方の処理がもう一方よりも効果が高いことを示しています。ただし、処理効果が有意だからといって、同等であると主張できないとは限りません。処理平均間の差は、まだ同等性限界内に収まっている可能性があります。
キャリーオーバー効果と期間効果のいずれかが統計的に有意な場合、同等性検定の結果は信頼できない可能性があります。また、処理効果をキャリーオーバー効果や期間効果と混同し、推定値が不確実になるおそれもあります。2x2交差計画を使用する場合は、データを収集して分析する前に、慎重に分析を計画してキャリーオーバー効果と期間効果を回避する必要があります。
期間統計量は、期間1と期間2の応答の差を測定します。たとえば、血圧を応答として測定する場合、期間2では、単に参加者が検定の環境と手順に慣れたために応答が低くなる場合があります。
期間効果のp値を有意水準(アルファまたはαで示されます)と比較します。0.05のαが一般的です。p値がαより小さい場合、期間効果は統計的に有意です。その場合、同等性検定の結果に偏りが生じる可能性があります。
効果 | 標準誤差 | 自由度 | t値 | p値 | 95% 同等の CI | |
---|---|---|---|---|---|---|
持ち越し | 0.45181 | 0.64988 | 15 | 0.69521 | 0.498 | (-0.93339, 1.8370) |
処理 | -0.32104 | 0.060641 | 15 | -5.2941 | 0.000 | (-0.45030, -0.19179) |
時期 | -0.097708 | 0.060641 | 15 | -1.6112 | 0.128 | (-0.22696, 0.031546) |
この結果で、推定される期間効果は−0.097708です。しかし、p値は0.128で、α(0.05)より高くなっています。したがって、期間効果は統計的に有意ではありません。
キャリーオーバー効果と期間効果のいずれかが統計的に有意な場合、同等性検定の結果は信頼できない可能性があります。また、処理効果をキャリーオーバー効果や期間効果と混同し、推定値が不確実になるおそれもあります。2x2交差計画を使用する場合は、データを収集して分析する前に、慎重に分析を計画してキャリーオーバー効果と期間効果を回避する必要があります。
各効果の標準誤差では、同じ母集団から繰り返しサンプルを抽出した場合に得られるサンプル効果の変動性が推定されます。
効果の標準誤差を使用して、ランダムサンプル変動性に関する各効果の推定値の精度を評価します。通常、標準誤差が小さいほど、効果の推定値の精度が高くなり、その信頼区間が狭くなります。
各効果をその標準誤差で割ると、効果のt値が計算されます。効果のサイズに関して標準誤差が小さいほど、t値の絶対値は大きくなります。このt値に関連付けられたp値がα水準より小さい場合、効果は統計的に有意であると結論付けます。詳細については、効果のp値に関するセクションを参照してください。
自由度とは、未知のパラメータの値を推定して推定値の変動性を計算するために利用することが可能なデータの情報量のことです。
Minitabでは、自由度を使用して検定統計量を計算します。 自由度は、サンプルサイズに影響を受けます。サンプルサイズを大きくすると、母集団に関して提供される情報が増え、自由度が高くなります。
t値とは、サンプルの変動性(標準誤差)に関連した効果の大きさを測定する検定統計量です。
t値を使用して、帰無仮説を棄却するかどうかを判断できます。ただし、ほとんどの人はp値または信頼区間のほうが解釈が容易であるため、こちらを使用します。
各効果を標準誤差で割ると、効果のt値が求められます。効果のサイズに対して標準誤差のサイズが小さいほど、t値の絶対値が大きくなり、帰無仮説に対する証拠が強力になります。
各効果のt値は、対応するp値を計算するために使用されます。このt値に関連付けられたp値が有意水準より小さい場合、効果は統計的に有意であると結論付けます。詳細については、効果のp値に関するセクションを参照してください。
p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。
2x2交差計画の同等性検定の場合、Minitabでは、キャリーオーバー効果、期間効果、および処理効果の各p値を計算します。
各効果のp値を使用して、効果が統計的に有意かどうかを判定します。各p値を有意水準(アルファまたはαで示されます)と比較します。通常、αの値として0.05が適しています。
キャリーオーバー効果と期間効果のいずれかが統計的に有意な場合、同等性検定の結果は信頼できない可能性があります。処理効果は、期間効果またはキャリーオーバー効果と交絡している可能性があります。2x2交差計画を使用する場合は、データを収集して分析する前に、慎重に分析を計画してキャリーオーバー効果と期間効果を回避する必要があります。
キャリーオーバー効果と期間効果が統計的に有意ではない場合は、処理効果が統計的に有意かどうかを判定します。通常、処理効果が対象の効果となります。
効果 | 標準誤差 | 自由度 | t値 | p値 | 95% 同等の CI | |
---|---|---|---|---|---|---|
持ち越し | 0.45181 | 0.64988 | 15 | 0.69521 | 0.498 | (-0.93339, 1.8370) |
処理 | -0.32104 | 0.060641 | 15 | -5.2941 | 0.000 | (-0.45030, -0.19179) |
時期 | -0.097708 | 0.060641 | 15 | -1.6112 | 0.128 | (-0.22696, 0.031546) |
この結果で、キャリーオーバー効果のp値と期間効果のp値はいずれも有意水準0.05より大きくなっています。したがって、これらの効果は統計的に有意ではありません。処理効果のp値が0.05より低い場合、処理間の差が統計的に有意であることを示しています。
処理効果が統計的に有意であっても、同等性を主張できないという意味ではありません。処理平均間の差は、まだ同等性限界内に収まっている可能性があります。等値プロットの結果を使用して、同等性を主張できるかどうか判定してください。詳細は、2x2交差計画の同等性検定のグラフを参照し、「等値プロット」をクリックしてください。
同等性の信頼区間は、サンプルに基づく各効果の値が含まれる可能性が高い範囲です。
各効果で、信頼区間とp値を使用して、効果が統計的に有意かを判定します。
効果 | 標準誤差 | 自由度 | t値 | p値 | 95% 同等の CI | |
---|---|---|---|---|---|---|
持ち越し | 0.45181 | 0.64988 | 15 | 0.69521 | 0.498 | (-0.93339, 1.8370) |
処理 | -0.32104 | 0.060641 | 15 | -5.2941 | 0.000 | (-0.45030, -0.19179) |
時期 | -0.097708 | 0.060641 | 15 | -1.6112 | 0.128 | (-0.22696, 0.031546) |
この結果で、キャリーオーバー効果の95%信頼区間は(−0.93339, 1.8370)で、期間効果の95%信頼区間は(−0.22696, 0.031546)です。ただし、どちらの効果も統計的に有意ではありません(p > 0.05)。処理効果の95%信頼区間は(−0.45030, −0.19179)です。処理効果は統計的に有意です(p = 0.000)。
キャリーオーバー効果と期間効果のいずれかが統計的に有意な場合、同等性検定の結果は信頼できない可能性があります。また、処理効果をキャリーオーバー効果や期間効果と混同し、推定値が不確実になるおそれもあります。2x2交差計画を使用する場合は、データを収集して分析する前に、慎重に分析を計画してキャリーオーバー効果と期間効果を回避する必要があります。