什么是正态分布?

正态分布是钟形分布,在该分布中,来自均值的连续标准差建立了用来估计数据观测值百分比的基准。这些基准是许多假设检验(如 Z 检验和 t 检验)的基础。

假设正态分布的直方图

由于此数据的分布是正态的,因此完全可以确定有多少百分比的值落在特定范围内。例如:
  • 大约 95% 的观测值与均值的标准差不超过 2,用蓝色阴影区域表示。有 95% 的值与均值的标准差不超过 1.96(−1.96 和 +1.96 之间)。因此,有不到 5% (0.05) 的观测值将位于此范围之外。此范围是许多假设检验的 alpha 水平 0.05 的基础。
  • 大约 68% 的观测值与均值的标准差不超过 1(-1 到 +1 之间),大约 99.7% 的观测值与均值的标准差不超过 3(-3 到 +3 之间)。

正态分布示例

居住在宾夕法尼亚州的所有成年男性的身高大致呈正态分布。因此,大多数男性的身高将接近平均身高 69 英寸。稍高于 69 英寸和稍矮于 69 英寸的男性数量基本相当。只有少数男性特别高或特别矮。标准差为 2.5 英寸。

大约 68% 的宾夕法尼亚州男性的身高介于 66.5 (μ - 1σ) 和 71.5 (μ + 1σ) 英寸之间。

大约 95% 的宾夕法尼亚州男性的身高介于 64 (μ - 2σ) 和 74 (μ + 2σ) 英寸之间。

大约 99.7% 的宾夕法尼亚州男性的身高介于 61.5 (μ - 3σ) 和 76.5 (μ + 3σ) 英寸之间。