変動性が分散分析に与える影響

下のデータセットは、まったく同じ因子水準平均を持っています。したがって、因子に起因するデータの変動性は、両方のデータセットに関して同じです。プロットを見ると、平均値差は両方のケースで異なっていると結論付けたくなります。ただし、因子水準内の変動性は、最初のデータセットよりも2番目のデータセットの方がかなり大きいことに注意してください。

平均値差を評価するには、これらの差と平均に関する観測値の広がりとを比較する必要があります。これはまさに分散分析が行う操作です。分散分析を使用すると、最初のプロットに対応するp値は0.000であり、2番目のプロットに対応するp値は0.128となります。

このため、有意水準が0.05の検定では、最初のデータセットの平均は有意に異なっていることになります。しかし、2番目のデータセットのサンプル平均における差は、明らかにデータの全体的な変動性のランダムな結果と言えます。

変動性の低いプロット
変動性の高いプロット