解释 双样本等价检验的功效和样本数量 的所有统计量和图形

请查找定义和解释指导,了解随双样本等价检验的功效和样本数量提供的每个统计量和图形。

差值的功效

第一行输出指示为等价检验指定假设的方式。

“差值的功效”指示假设是用检验总体的均值与参考总体的均值之间的差值(检验均值 – 参考均值)来指定的。

比值的功效

第一行输出指示为等价检验指定假设的方式。

“比值的功效”指示假设是用检验总体的均值与参考总体的均值之间的比值(检验均值/参考均值,用对数变换表示)来指定的。

原假设和备择假设

原假设和备择假设是针对总体的互斥声明。等价检验使用样本数据来确定是否要拒绝原假设。
原假设
Minitab 根据您选择的备择假设,检验下面的两个原假设中的一个或两个:
  • 检验总体的均值与参考总体的均值之间的差值(或比值)大于或等于等价上限。
  • 检验总体的均值与参考总体的均值之间的差值(或比值)小于或等于等价下限。
备择假设
备择假设声明下面的一项或两项:
  • 检验总体的均值与参考总体的均值之间的差值(或比值)小于等价上限。
  • 检验总体的均值与参考总体的均值之间的差值(或比值)大于等价下限。

解释

使用原假设和备择假设可以验证等价标准是否正确,以及您是否选择了适合的备择假设进行检验。

方法

差值的功效: 检验均值 - 参考均值
原假设:差值 ≤ -1 或差值 ≥ 1
备择假设:-1 < 差值 < 1
α 水平:0.05
假定的标准差:0.41

在这些结果中,Minitab 检验两个原假设:
  • 检验总体的均值与参考总体的均值之间的差值小于或等于等价下限 −1
  • 检验总体的均值与参考总体的均值之间的差值大于或等于等价上限 1
备择假设是差值介于等价下限和等价上限之间(即,检验总体的均值与参考总体的均值等价)。

α (alpha)

显著性水平(用 alpha 或 α 表示)是在原假设为真时否定原假设(I 型错误)所带来风险的最大可接受水平。例如,如果您使用默认假设执行等价检验,则 α 为 0.05 表示当检验均值与参考均值之间的差值实际上不在等价限值范围内时,声明二者等价的风险为 5%。

等价检验的 α 水平还确定等价区间的置信水平。默认情况下,置信水平为 (1 – α) x 100%。如果您使用备择方法计算置信区间,则置信水平为 (1 – 2α) x 100%。

解释

使用显著性水平可以在原假设 (H0) 为真时最小化检验的功效值。显著性水平越高,检验功效越大,犯 I 型错误(否定原本为真的原假设)的概率越大。

假定标准差

标准差是离差的最常用度量,即数据与均值的接近程度。对某一过程而言随机或合乎自然规律的变异通常称为噪声。

解释

假定标准差是您为功效分析输入的总体标准差的计划估计值。Minitab 使用假定标准差计算检验的功效。标准差的值越大,数据中的变异性越大,检验的统计功效越低。

差值

此值表示检验总体的均值与参考总体的均值之间的差值。

注意

本主题中的定义和解释适用于使用默认备择假设(下限 < 检验均值 - 参考均值 < 上限)的标准等价检验。

解释

如果您输入检验的样本数量和功效,则 Minitab 将计算检验在指定功效和样本数量下可接受的差值。样本数量越大,差值越接近等价限值。

使用功效曲线可以更完整地研究样本数量与检验在给定功效下可接受的差值之间的关系。

方法

差值的功效: 检验均值 - 参考均值
原假设:差值 ≤ -1 或差值 ≥ 1
备择假设:-1 < 差值 < 1
α 水平:0.05
假定的标准差:0.41

结果

样本数量功效差值
80.9-0.368540
80.90.368540
120.9-0.494285
120.90.494285
200.9-0.613616
200.90.613616
样本数量是指每个组的。

这些结果表明,样本数量越大,在给定功效水平下可接受的差值也越大:

  • 如果每个组中有 8 个观测值,则当差值大约介于 −0.37 和 0.37 之间时,检验的功效至少为 0.9。
  • 如果每个组中有 12 个观测值,则当差值大约介于 −0.49 和 0.49 之间时,检验的功效至少为 0.9。
  • 如果每个组中有 20 个观测值,当差值大约介于 -0.61 和 0.61 之间时,检验的功效至少为 0.9。

比值

此值表示检验总体的均值与参考总体的均值之间的比值。要为比值执行功效计算,您必须选择一个有关检验均值 / 参考均值 (比值,通过对数变换)的假设。

注意

本主题中的定义和解释适用于使用针对比值的默认备择假设(下限 < 检验均值 / 参考均值 < 上限)的等价检验。

解释

如果您输入检验的样本数量和功效,则 Minitab 将计算检验在指定功效和样本数量下可接受的最小比值和最大比值。样本数量越大,比值越接近等价限值。

使用功效曲线可以更完整地研究样本数量与检验在给定功效下可接受的比值之间的关系。

方法

比值功效:检验均值 / 参考均值
原假设:比值 ≤ 0.9 或比值 ≥ 1.1
备择假设:0.9 < 比值 < 1.1
α 水平:0.05
假定的变异系数:0.09

结果

样本数量功效比值
100.9*
250.90.97060
250.91.01999
350.90.95897
350.91.03235
样本数量是指每个组的。

这些结果表明样本数量越大,在给定功效水平下可接受的比值范围越大:

  • 如果每个组中有 10 个观测值,则对于任何比值都无法达到 0.9 的功效。
  • 如果每个组中有 25 个观测值,当比值大约介于 0.97 和 1.02 之间时,检验的功效至少为 0.9。
  • 如果每个组中有 35 个观测值,当比值大约介于 0.96 和 1.03 之间时,检验的功效至少为 0.9。

样本数量

样本数量是样本中的观测值总数。对于双样本等价检验,样本数量是指两个组中的每个组包含的观测值个数。

解释

使用样本数量可以估计在特定差值下,等价检验取得特定功效值所需的观测值个数。

如果您输入检验的差值(或比值)和功效值,Minitab 将计算样本必须为多大。 因为样本数量是整数,所以检验的实际功效可能比指定的功效值稍大。

样本数量越大,检验功效也会越高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。

使用功效曲线可以更完整地研究样本数量与检验在给定功效下可接受的差值(或比值)之间的关系。

方法

差值的功效: 检验均值 - 参考均值
原假设:差值 ≤ -1 或差值 ≥ 1
备择假设:-1 < 差值 < 1
α 水平:0.05
假定的标准差:0.41

结果

差值样本数量目标功效实际功效
0.5130.90.915407
0.7330.90.902461
0.92890.90.900360
样本数量是指每个组的。

这些结果表明,当差值增加到接近等价限值时,需要使用较大的样本数量来达到给定的功效。如果差值为 0.5,则每个组中需要有 13 个观测值才能达到功效 0.9。样本数量为 13 时,功效大约为 0.92。如果差值为 0.9,则每个组中至少需要 289 个观测值才能达到功效 0.9。

功效

等价检验的功效是指确实存在差值(或比值)时,检验证实该值在等价限值内的概率。等价检验的功效受检验的样本数量、差值、等价限值、数据变异性和显著性水平的影响。

有关更多信息,请转到等价检验的功效

解释

如果您输入样本数量和差值(或比值),Minitab 会计算检验的功效。功效值 0.9 通常被认为已足够。如果功效为 0.9,则表示当总体均值的差值(或比值)实际位于等价限值内时,证实等价的概率为 90%。如果等价检验的功效较低,您可能无法证实等价,即使在检验均值和参考均值相等时也是如此。

如果您输入检验的差值(或比值)和功效值,Minitab 将计算样本必须为多大。Minitab 还将计算该样本数量检验的实际功效。因为样本数量是整数,所以检验的实际功效可能比指定的功效值稍大。

通常情况下,样本数量越小或者差值(或比值)越接近等价限值时,检验得出等价结论的功效就越低。

方法

差值的功效: 检验均值 - 参考均值
原假设:差值 ≤ -1 或差值 ≥ 1
备择假设:-1 < 差值 < 1
α 水平:0.05
假定的标准差:0.41

结果

差值样本数量功效
0.580.749766
0.5150.946583
0.5250.995405
0.880.236964
0.8150.366456
0.8250.522098
样本数量是指每个组的。

在这些结果中,对于 0.5 的差值,样本数量为 8 时功效大约为 0.75。但是,对于 0.8 的差值,在相同的样本数量下,功效仅大约为 0.24。对于每个不同的差值,增加样本数量可以提高检验的功效。

功效曲线

功效曲线描绘了检验的功效与检验均值和参考均值之间差值(或比值)的关系。

解释

使用功效曲线可以为您的检验评估合适的样本数量或功效。

功效曲线表示当显著性水平和标准差(或方差系数)保持恒定时,每个样本数量的每个功效与差值(或比值)组合。功效曲线上的每个符号都表示一个基于输入值的计算值。例如,如果您输入一个样本数量和一个功效值,Minitab 会计算相应的差值(或比值)并将计算值显示在图形上。

检查曲线上的值,确定可以在特定功效值和样本数量处接受的检验均值与参考均值之间的差值(或比值)。通常认为功效值为 0.9 足矣。但是,有些从业者认为功效值为 0.8 足矣。如果假设检验的功效较低,则可能无法证明等价,即使总体均值等价也是如此。如果增加样本数量,检验功效也会提高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。 通常,差值(或比值)越接近等价限值,证明等价所需的功效越大。

在此图形中,样本数量 8(在每个组中)的功效曲线表明,对于大约 ±0.4 的差值,检验的功效为 0.9。样本数量 12 的功效曲线表明,对于大约 ±0.5 的差值,检验的功效为 0.9。样本数量 12 的功效曲线表明,对于大约 ±0.6 的差值,检验功效为 0.9。对于每条曲线,当差值接近等价下限或等价上限时,检验的功效会降低并接近 α(alpha,即在不等价时声明等价的风险)。