分散分析(ANOVA)とは

分散分析(ANOVA)では、2つ以上の母集団の平均が等しいという仮説が検定されます。分散分析では、1つ以上の因子の重要性を、異なる因子水準での応答変数平均を比較することにより評価します。帰無仮説はすべての母集団平均(因子水準平均)が等しいとするもので、対立仮説は少なくとも1つの母集団平均が異なるというものです。

分散分析(ANOVA)を実行するには、連続する応答変数と、複数の水準を持つカテゴリ因子が少なくとも1つ必要です。分散分析では、正規分布に近似した母集団からのデータと、因子水準間の変動が等しいデータを使用する必要があります。ただし分散分析は、1つ以上の分布が大きく歪んでいないか、または分散量が非常に異なるのでない限り、正規性の前提が満たされていない場合でも比較的有効です。元のデータセットを変換することでこれらの違反を修正できます。

たとえば、カーペット製品の試作品4つの耐久性を評価する実験を計画するとします。各タイプのカーペットのサンプルを10軒の家庭に配置し、60日後に耐久性を測定します。1つの因子(カーペットのタイプ)を検査するので、一元配置分散分析(ANOVA)を使用します。

p値がα値より小さい場合は、少なくとも1つの耐久性平均が異なると結論します。特定の平均間の差を更に調べたい場合は、テューキーの方法などの多重比較を行ってください。

「分散分析」という名前は、この手法が分散を使用して複数の平均が異なるかどうかを判断することから来ています。この手法は、グループ間平均の分散とグループ内平均の分散を比較することで、それらのグループが1つの大規模な母集団の一部であるのか、あるいは異なる特性を持つ別個の母集団であるのかを判断します。