解释 Mann-Whitney 检验 的所有统计量

请查找定义和解释指导,了解随 Mann-Whitney 分析提供的每个统计量。

N

样本数量 (N) 是样本中的观测值总数。

解释

样本数量会影响置信区间和检验功效。

通常,数量较大的样本将产生较窄的置信区间。样本数量越大,检验检测到差值的功效越大。有关更多信息,请转到什么是功效?

中位数

中位数是数据集的中点。在此中点值所在的点上,有一半的观测值大于中点值,有一半的观测值小于中点值。中位数是通过对观测值排秩并在秩顺序中查找第 [N + 1] / 2 位的观测值来确定的。如果观测值数为偶数,则中位数是排在第 N / 2 位和第 [N / 2] + 1 位的观测值的平均值。

解释

The median of each sample is an estimate of the population median of each sample.

差值

差值是两个样本的中位数之间的差值。

由于差值基于样本数据而不是整个总体,因此样本差值通常不等于总体差值。使用置信区间可以更好地估计总体差值。

置信区间(差值的置信区间)和边界

置信区间提供总体差值的可能值范围。由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间或限值会包含未知的总体差值。这些包含差值的置信区间或限值的百分比是区间的置信水平。例如,95% 置信水平表明,如果从总体中随机抽取 100 个样本,则大约 95 个样本将产生包含总体差值的区间。

上限定义可能大于总体差值的值。下限定义可能小于总体差值的值。

置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。

差值的估计值

差值差值的置信区间取得的置信度
-1.85(-3, -0.9)95.52%

在这些结果中,对于两条公路上所使用油漆的耐用月数,总体中位数差值的估计值为 −1.85。总体中位数的差值介于 −3.0 和 −0.9 之间的可信度为 95.52%。

原假设和备择假设

原假设和备择假设是互斥的总体声明。假设检验使用样本数据来确定是否要否定原假设。
原假设
原假设声明总体参数(如均值、标准差等)等于假设值。原假设通常是基于先前分析或专业知识的初始声明。
备择假设
备择假设声明总体参数小于、大于或不同于原假设中的假设值。备择假设是可能相信为真实或有望证明为真实的内容。

W 值

Mann-Whitney 统计量(W 值)是第一个样本的秩的和。

Minitab 按如下公式计算 Mann-Whitney 统计量:
  1. Minitab 对两个结合值进行排秩。Minitab 为最小的观测值赋予秩 1,为第二小的观测值赋予秩 2,以此类推。
  2. 如果将两个或更多观测值相结合,Minitab 将为这两个观测值分配平均秩。
  3. Minitab 求第一个样本的秩的和。

解释

Minitab 使用 Mann-Whitney 统计量计算 p 值(一种概率,用来度量否定原假设的证据)。

由于对 Mann-Whitney 统计量的解释取决于样本数量,您可以使用 p 值来做出检验决策。对于所有的样本数量来说,P 值的含义都相同。

P 值

P 值是一个概率,用来度量否定原假设的证据。P 值越小,否定原假设的证据越充分。

解释

使用 p 值可确定总体中位数的差值在统计意义上是否显著。

要确定中位数的差值在统计意义上是否显著,请将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在差值时得出存在差值的风险为 5%。
P 值 ≤ α:中位数的差值在统计意义上显著(否定 H0
如果 p 值小于或等于显著性水平,则决策为否定原假设。您可以得出总体中位数的差值在统计意义上显著的结论。请使用您的专业知识确定差值在实际意义上是否显著。有关更多信息,请转到统计显著性和实际显著性
P 值 > α:中位数的差值在统计意义上不显著(无法否定 H0
如果 p 值大于显著性水平,则决策为无法否定原假设。您没有足够的证据得出总体中位数的差值在统计意义上显著的结论。您应该确保检验具有足够的功效来检测到在实际意义上显著的差值。

在两个样本中出现了相同值时会出现结。如果数据具有结,Minitab 将显示针对结进行调整的 p 值和未调整的 p 值。调整的 p 值通常比未调整的 p 值更准确。但是,未调整的 p 值是更保守的估计值,其原因是对于特定的样本对,未调整的 p 值始终大于调整的 p 值。