中心極限定理: 大きいランダムサンプルの平均はほぼ正規になる

中心極限定理は、確率と統計の基本的定理です。この定理は、有限分散の母集団から収集したランダムサンプルの平均の分布を記述します。サンプルサイズが十分に大きい場合、平均の分布は近似的に正規分布になります。この定理は、母集団の分布の形状に関係なく適用されます。一般的な統計手順の多くでは、データが近似的に正規である必要があります。中心極限定理により、こうした便利な手順をかなり非正規な母集団に適用できます。必要なサンプルサイズは、元の分布の形状によって決まります。母集団の分布が対称な場合、サンプルサイズ5で十分な近似が得られる可能性があります。母集団の分布がきわめて非対称な場合、大きなサンプルサイズが必要になります。たとえば、サンプルサイズが50よりも大きい場合、平均の分布は近似的に正規になる可能性があります。次のグラフは、必要なサンプルサイズに分布が及ぼす影響の例を示しています。

一様分布
サンプル平均
一様母集団のサンプル

最初のヒストグラムが示すとおり、一様分布に従う母集団は対称ですが、極めて非正規です。しかし、2番目のヒストグラムが示すとおり、中心極限定理により、この母集団からのサイズ5の1000個のサンプル平均の分布は近似的に正規です。このサンプル平均のヒストグラムに重ね合わされた正規曲線は、正規性を示しています。

指数分布
サンプル平均
指数母集団のサンプル

最初のヒストグラムが示すように、指数分布に従う母集団は対称かつ非正規です。しかし、2番目のヒストグラムが示すとおり、中心極限定理により、この母集団からのサイズ50の1000個のサンプル平均の分布は近似的に正規です。このサンプル平均のヒストグラムに重ね合わされた正規曲線は、正規性を示しています。