获得和解释 p 值的示例

您希望确定一种新的汽油添加剂对汽油英里数是否有影响。如果此特定级别汽车的已知汽油英里数为 25 英里每加仑 (mpg)，则此研究的假设为 H₀：μ = 25 和 H_A：μ ≠ 25。

从单样本 t 检验获得 p 值

您检验 35 辆车，发现在这些车中每加仑汽油跑的英里数介于 14.4 到 28.8 之间。在将数据放到 MPG 列中之后，执行 Minitab 的 t 检验（菜单命令统计 > 基本统计 > 单样本 t 或会话命令 TTEST）并获得以下结果：

单样本 T: C1

描述性统计量均值标 μ 的 95% 置信 N 均值标准差准误区间 35 23.657 3.416 0.577 (22.484, 24.831) μ: C1 的均值

检验原假设 H₀: μ = 25 备择假设 H₁: μ ≠ 25

T 值 P 值 -2.33 0.026

解释 p 值

结果显示，35 辆汽车样本的均值为 23.657。但是，这种类型的所有汽车的每加仑英里数的均值 (μ) 可能仍为 25。您希望了解是否有充足的样本证据来否定 H₀。最常见的方法是比较 p 值与显著性水平 α (alpha)。α 是当 H₀ 为真时否定 H₀ 的概率。在此例中，这就是得出总体均值不是 25 mpg（而实际上是）的结论的概率。

p 值用来对照 H₀ 计量数据证据的强度。通常，p 值越小，否定 H₀ 的样本证据越强大。更具体地说，p 值是导致否定 H₀ 的最小 α 值。对于任何大于 α 的 p 值，将无法否定 H₀，而对于任何 α 的 p 值，将否定 H₀。

在我们的 t 检验示例中，检验统计量是均值的函数，p 值是 0.026。这表示 2.6% 的数量为 35 的样本（从 μ = 25 的总体中抽取）所生成的均值将与 μ 不等于 25 的当前样本提供相同强度（或更强）的证据。询问自己下面哪种情况可能性更大：μ = 25 而且您恰好刚刚选择一个非常罕见的样本；还是 μ 不等于 25？

在以前，根据研究的领域，会将 p 值与小于 0.05 或 0.01 的 α 值进行比较。请在与您的领域相对应的杂志主题中查找可接受的值。

在我们的示例中，让我们假定 α 值为 0.05。p 值为 0.026 表示所有此类型汽车的每加仑英里数均值（不仅仅是该研究中 35 辆汽车的均值）可能不等于 25。统计学上更正确的说法是“在 0.05 的显著性水平下，每加仑英里数均值似乎显著不同于 25”。

因此，如果您知道以下两个关键事实，则 p 值的使用会非常简单：您的领域中可接受的 α 值，要使用的检验的原假设和备择假设。