获得和解释 p 值的示例

您希望确定一种新的汽油添加剂对汽油英里数是否有影响。如果此特定级别汽车的已知汽油英里数为 25 英里每加仑 (mpg),则此研究的假设为 H0:μ = 25 和 HA:μ ≠ 25。

从单样本 t 检验获得 p 值

您检验 35 辆车,发现在这些车中每加仑汽油跑的英里数介于 14.4 到 28.8 之间。在将数据放到 MPG 列中之后,执行 Minitab 的 t 检验(菜单命令统计 > 基本统计 > 单样本 t 或会话命令 TTEST)并获得以下结果:

单样本 T: C1

描述性统计量 均值标 μ 的 95% 置信 N 均值 标准差 准误 区间 35 23.657 3.416 0.577 (22.484, 24.831) μ: C1 的均值
检验 原假设 H₀: μ = 25 备择假设 H₁: μ ≠ 25
T 值 P 值 -2.33 0.026

解释 p 值

结果显示,35 辆汽车样本的均值为 23.657。但是,这种类型的所有汽车的每加仑英里数的均值 (μ) 可能仍为 25。您希望了解是否有充足的样本证据来否定 H0。最常见的方法是比较 p 值与显著性水平 α (alpha)。α 是当 H0 为真时否定 H0 的概率。在此例中,这就是得出总体均值不是 25 mpg(而实际上是)的结论的概率。

p 值用来对照 H0 计量数据证据的强度。通常,p 值越小,否定 H0 的样本证据越强大。更具体地说,p 值是导致否定 H0 的最小 α 值。对于任何大于 α 的 p 值,将无法否定 H0,而对于任何 α 的 p 值,将否定 H0

在我们的 t 检验示例中,检验统计量是均值的函数,p 值是 0.026。这表示 2.6% 的数量为 35 的样本(从 μ = 25 的总体中抽取)所生成的均值将与 μ 不等于 25 的当前样本提供相同强度(或更强)的证据。询问自己下面哪种情况可能性更大:μ = 25 而且您恰好刚刚选择一个非常罕见的样本;还是 μ 不等于 25?

在以前,根据研究的领域,会将 p 值与小于 0.05 或 0.01 的 α 值进行比较。请在与您的领域相对应的杂志主题中查找可接受的值。

在我们的示例中,让我们假定 α 值为 0.05。p 值为 0.026 表示所有此类型汽车的每加仑英里数均值(不仅仅是该研究中 35 辆汽车的均值)可能不等于 25。统计学上更正确的说法是“在 0.05 的显著性水平下,每加仑英里数均值似乎显著不同于 25”。

因此,如果您知道以下两个关键事实,则 p 值的使用会非常简单:您的领域中可接受的 α 值,要使用的检验的原假设和备择假设。