等分散性検定とは

等分散検定を使用し、母集団間や因子水準間の分散の同等性を検定します。分散分析(ANOVA)や回帰などの多くの統計的手法では、異なるサンプルが平均値の異なる母集団から採取されるとしても、同じ分散を持つと仮定しています。

不等分散による影響は、分散分析(ANOVA)の手順によって大きく異なります。そのため、等分散性検定を実施する必要があります。例えば、モデルに固定因子のみが含まれ、サンプルサイズがほとんど等しい場合、分散分析の推定値は不等分散による影響をわずかしか受けません。一方、ランダム効果が含まれ、サンプルサイズが異なる分散分析では、大きな影響を受ける可能性があります。

たとえば、主な固定因子がコールセンターである場合に、電話をかけてきた人が保留されるときの時間について分散分析(ANOVA)検定を実施する計画を立てるとします。サンプルサイズが均等ではないので、分散分析の一般線形モデル(GLM)を使用します。このアンバランスな条件によって不均等な分散の影響を受けやすくなるため、等分散仮定について検定することにします。結果のp値が適切なα値より大きい場合は、分散が均等であるという帰無仮説を棄却できません。よって、等分散仮定がはてはまると確信できます。

等分散性検定における仮説は次の通りです
  • H0: すべての分散が等しい
  • H1:すべての分散が等しいとは限らない

どの検定に基づいて結論を導くべきか

デフォルトのMinitab等分散性検定コマンドでは、ルビーンの方法と多重比較の方法の両方の結果が表示されます。ほとんどの連続分布において、この2つの方法では特定の有意水準(αまたはアルファとも呼ばれる)に近い第1種過誤率の原因となります。通常、多重比較の方法の方がより検出力が高いです。多重比較の方法でのp値が有意である場合、要約プロットを使って他と異なる標準偏差を持つ母集団を特定することができます。次の項目に当てはまらない限り、多重比較の方法による結果から結論を導いてください。
  • 各サンプルの観測値は20未満です。
  • 1つ以上の母集団の分布は、偏りが大きいか裾が重くなっています。正規分布に比べ、裾が重い分布では、下端と上端にデータが集まっています。

偏りが大きい分布や裾の重い分布からのデータがある場合、多重比較の方法における第1種過誤率はαよりも高くなる可能性があります。この状態でルビーンの方法が算出するp値の方が多重比較のそれよりも小さい場合、ルビーンの方法から結論を導いてください。p値の値が大きい場合は多重比較から結論を導けますが、第1種過誤率はαよりも高まる可能性が高いことを忘れないでください。

F検定とバートレットの検定

多重比較とルビーンの方法の代わりに、正規分布に基づいて検定の結果を表示することもできます。グループや因子水準が2つしかない場合は、MinitabではF検定が実行されます。グループや因子水準が3つ以上の場合は、バートレットの検定が実行されます。

F検定とバートレットの検定は正規に分布したデータでのみ正確になります。正規性からのいかなる逸脱も不正確な検定結果の原因となる可能性があります。しかし、データが正規分布に従っている場合、F検定とバートレットの検定は、多重比較やルビーンの方法に比べて検出力は高いです。