多重比較における個別および同時信頼水準を理解する

分散分析(ANOVA)において特定の因子水準間の有意差を識別するために、多重比較で使われる信頼区間に関連する信頼水準。これらの信頼水準は、個別および全体過誤率に似ていますが、信頼区間に適用されます。

個別信頼水準とは

分析が2回以上繰り返された場合に、真の母数または因子水準間の真の差が含まれる信頼区間の割合です。

同時信頼水準とは

分析が2回以上繰り返された場合に、信頼区間のグループに真の母数または因子水準間の真の差が含まれる回数の割合。同時信頼水準は、個別信頼水準と信頼区間数の両方に基づきます。1つの比較の場合、同時信頼水準は個別信頼水準に等しくなります。ただし、信頼区間が追加されるたびに、同時信頼水準は累積して小さくなります。

全体信頼区間の場合、パラメータまたは因子水準間の真の差が含まれない確率は単一の信頼区間より高くなるため、複数の信頼区間を調べる場合には同時信頼水準を考慮することが重要です。

テューキーの方法、フィッシャーのLSD(最小有意差)、スーのMCB(最良値との多重比較)、ボンフェローニの信頼区間は、個別および同時信頼水準を計算し、管理するための方法です。

個別信頼区間と同時信頼区間の例

たとえば、メモリチップの応答時間を測定するとします。5社のメーカーからサンプルとして25個のチップを抽出しました。

5つの工場間の10個すべての比較を調べ、具体的にどの平均が異なっているのかを判断することにします。テューキーの方法を使って、信頼区間のセット全体に95%の同時信頼水準を指定します。Minitabの計算によると、95%の同時信頼水準を得るには、10個の個別信頼水準が99.35%であることが必要です。幅の広いテューキー信頼区間では母数の推定が不正確になりますが、真の差を含まない信頼区間が1つ以上ある確率は最大5%に制限されます。この内容を理解したうえで、次に信頼区間を調べ、ゼロを含む(有意な差を示唆する)信頼区間がないかを確認できます。

個別の信頼水準が95%の信頼区間
テューキーの方法を使って95%の同時信頼水準を得るために99.35%の個別信頼水準を持つ信頼区間

95%の信頼区間と上の例のテューキーの方法で使用した幅の広い99.35%の信頼区間の比較。0の参照ラインは、幅の広いテューキーの信頼区間によって結論がいかに変わるかを示しています。ゼロを含む信頼区間は、差がないことを示します。(スペースの関係上、10個の比較のうち5つのみを示しています)