解释 单样本 Wilcoxon 的所有统计量

请查找定义和解释指导,了解随单样本 Wilcoxon 分析提供的每个统计量。

N

样本数量 (N) 是样本中的观测值总数。

解释

样本数量会影响置信区间和检验功效。

通常,数量较大的样本将产生较窄的置信区间。样本数量越大,检验检测到差值的功效越大。有关更多信息,请转到什么是功效?

中位数

中位数是成对平均值的中点。配对平均数(也称为 Walsh 平均数)是数据集内每个可能的值对的均值,包括每个值与其本身组成的值对。中位数是通过对成对平均值进行排名并按排名顺序找到数字 [N + 1] / 2 的值来确定的。如果观测值的数量为偶数,则中位数是按数字 N / 2 和 [N / 2] + 1 排列的成对平均值的平均值。

解释

成对平均值的中位数是总体中位数的估计值。

由于中位数基于样本数据而不是整个总体,因此样本中位数通常不等于总体中位数。使用置信区间可以更好地估计总体中位数。

注意

To get both the confidence interval and the test results you must perform the analysis twice because Minitab only calculates one item at a time.

置信区间(η 的置信区间)

置信区间提供总体中位数的可能值范围。由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间或限值会包含未知的总体中位数。这些包含中位数的置信区间或限值的百分比是区间的置信水平。例如,95% 置信水平表明,如果从总体中随机抽取 100 个样本,则大约 95 个样本将产生包含总体中位数的区间。

上限定义可能大于总体中位数的值。下限定义可能小于总体中位数的值。

置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。

由于 Wilcoxon 统计量的不连续性,因此不能始终获得具备要求的置信水平的置信区间。Minitab 使用正态近似和连续校正计算出最接近的取得值。

注意

To get both the confidence interval and the test results you must perform the analysis twice because Minitab only calculates one item at a time.

描述性统计量

样本N中位数η 的置信区间取得的置信度
时间1611.55(9.2, 12.6)94.75%

在这些结果中,反应时间的总体中位数估计值为 11.55。总体中位数介于 9.2 和 12.6 之间的可信度为 94.75%。

取得的置信度

由于 Wilcoxon 统计量的不连续性,因此不能始终获得具备要求的置信水平的置信区间。Minitab 使用正态近似和连续校正计算出最接近的取得值。

取得的置信度指示置信区间中包含总体中位数的可能性有多大。例如,95% 置信水平表明,如果从总体中随机抽取 100 个样本,则大约 95 个样本将产生包含总体中位数的区间。

原假设和备择假设

原假设和备择假设是互斥的总体声明。假设检验使用样本数据来确定是否要否定原假设。
原假设
原假设声明总体参数(如均值、标准差等)等于假设值。原假设通常是基于先前分析或专业知识的初始声明。
备择假设
备择假设声明总体参数小于、大于或不同于原假设中的假设值。备择假设是可能相信为真实或有望证明为真实的内容。

在输出中,原假设和备择假设可帮助您验证是否为检验中位数输入了正确的值。

检验 N

为计算单样本 Wilcoxon 检验的 N,Minitab 将排除等于假设中位数的观测值。单样本 Wilcoxon 检验的 N 等于其余观测值的数目。

解释

单样本 Wilcoxon 检验的 N 将影响检验的功效。值越大,检验检测到差值的功效越大。有关更多信息,请转到什么是功效?

Wilcoxon 统计量

Wilcoxon 统计量等于超过假设中位数的配对平均数(又称为 Walsh 平均数)的数量与 1/2 的等于假设中位数的配对平均数的数量之和。

Minitab 按如下方式计算 Wilcoxon 统计量:
  1. Minitab 排除了任何等于假设中位数的观测值。
  2. 对于 i < j,Minitab 构造配对 (Walsh) 平均数 (Yi + Yj) / 2。
  3. Minitab 按如上所述计算统计量。

解释

Minitab 使用 Wilcoxon 统计量计算 p 值(一种概率,用来度量否定原假设的证据)。

由于对 Wilcoxon 统计量的解释取决于样本数量,您应当使用 p 值来做出检验决策。对于所有样本数量来说,p 值的含义都相同。

P 值

P 值是一个概率,用来度量否定原假设的证据。P 值越小,否定原假设的证据越充分。

解释

使用 p 值可确定总体中位数在统计意义上是否不同于假设中位数。

要确定总体中位数和假设中位数的差值在统计意义上是否显著,请将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在差值时得出存在差值的风险为 5%。
P 值 ≤ α:中位数的差值在统计意义上显著(否定 H0
如果 p 值小于或等于显著性水平,则决策为否定原假设。您可以得出总体中位数和假设中位数的差值在统计意义上显著的结论。请使用您的专业知识确定差值在实际意义上是否显著。有关更多信息,请转到统计显著性和实际显著性
P 值 > α:中位数的差值在统计意义上不显著(无法否定 H0
如果 p 值大于显著性水平,则决策为无法否定原假设。您没有足够的证据得出总体中位数与假设中位数存在显著差异的结论。您应该确保检验具有足够的功效来检测到在实际意义上显著的差值。