解释 单样本等价检验的功效和样本数量 的所有统计量和图形

请查找定义和解释指导,了解随单样本等价检验的功效和样本数量提供的每个统计量和图形。

差值的功效

第一行输出指示为等价检验指定假设的方式。

“差值的功效”指示假设是用检验总体的均值与目标值之间的差值(检验均值 – 目标值)来指定的。

原假设和备择假设

原假设和备择假设是针对总体的互斥声明。等价检验使用样本数据来确定是否要拒绝原假设。
原假设
Minitab 根据您选择的备择假设,检验下面的两个原假设中的一个或两个:
  • 总体均值与目标之间的差值大于或等于等价上限。
  • 总体均值与目标之间的差值小于或等于等价下限。
备择假设
备择假设声明下面的一项或两项:
  • 总体均值与目标之间的差值小于等价上限。
  • 总体均值与目标之间的差值大于等价上限。

解释

使用原假设和备择假设可以验证等价标准是否正确,以及您是否选择了适合的备择假设进行检验。

单样本等价检验 方法 差值的功效: 检验均值 - 目标值 原假设: 差值 ≤ -0.42 或差值 ≥ 0.42 备择假设: -0.42 < 差值 < 0.42 α 水平: 0.05 假定的标准差: 0.332

在这些结果中,Minitab 检验两个原假设:
  • 总体均值与目标之间的差值小于或等于等价下限 −0.42
  • 总体均值与目标之间的差值大于或等于等价上限 0.42
备择假设是差值介于等价下限和等价上限之间(即,总体均值与目标等价)。

α (alpha)

显著性水平(用 alpha 或 α 表示)是在原假设为真时否定原假设(I 型错误)的风险的最大可接受水平。例如,如果您使用默认假设执行等价检验,则 α 为 0.05 表示当均值和目标之间的差值实际上不在等价限值范围内时,声明等价的风险为 5%。

等价检验的 α 水平还确定等价区间的置信水平。默认情况下,置信水平为 1 – α,如果您使用备择方法计算置信区间,则置信水平为 1 – 2α。

解释

使用显著性水平可以在原假设 (H0) 为真时最小化检验的功效值。显著性水平越高,检验功效越大,犯 I 型错误(否定原本为真的原假设)的概率越大。

假定标准差

标准差是离差的最常用度量,即数据与均值的接近程度。对某一过程而言随机或合乎自然规律的变异通常称为噪声。

解释

假定标准差是您为功效分析输入的总体标准差的计划估计值。Minitab 使用假定标准差计算检验的功效。标准差的值越大,数据中的变异性越大,检验的统计功效越低。

差值

此值表示总体均值和目标之间的差值。

注意

本主题中的定义和解释适用于使用默认备择假设(下限 < 检验均值 - 目标值 < 上限)的标准等价检验。

解释

如果您输入检验的样本数量和功效,则 Minitab 将计算检验在指定功效和样本数量下可接受的差值。样本数量越大,差值越接近等价限值。

使用功效曲线可以更完整地研究样本数量与检验在给定功效下可接受的差值之间的关系。

这些结果表明,样本数量越大,在给定功效水平下可接受的差值也越大:

  • 对于 30 个观测值,无论差值为多大,在声明等价时都无法达到 0.9 的功效。
  • 对于 40 个观测值,当差值大约介于 −0.07 和 0.07 之间时,检验的功效至少为 0.9。
  • 对于 60 个观测值,当差值大约介于 -0.14 和 0.14 之间时,检验的功效至少为 0.9。
  • 对于 100 个观测值,当差值大约介于 -0.20 和 0.20 之间时,检验的功效至少为 0.9。

Power and Sample Size

1-Sample Equivalence Test Power for difference: Test mean - target Null hypothesis: Difference ≤ -0.42 or Difference ≥ 0.42 Alternative hypothesis: -0.42 < Difference < 0.42 α level: 0.05 Assumed standard deviation: 0.732
Sample Size Power Difference 30 0.9 * 40 0.9 -0.071272 40 0.9 0.071272 60 0.9 -0.140212 60 0.9 0.140212 100 0.9 -0.204306 100 0.9 0.204306

样本数量

样本数量是样本中的观测值总数。

解释

使用样本数量可以估计在特定差值下,等价检验取得特定功效值所需的观测值个数。

如果您输入检验的差值和功效值,Minitab 将计算样本必须为多大。因为样本数量是整数,所以检验的实际功效可能比指定的功效值稍大。

样本数量越大,检验功效也会越高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。

使用功效曲线可以更完整地研究样本数量与检验在给定功效下可接受的差值之间的关系。

功效和样本数量

单样本等价检验 方法 差值的功效: 检验均值 - 目标值 原假设: 差值 ≤ -0.42 或差值 ≥ 0.42 备择假设: -0.42 < 差值 < 0.42 α 水平: 0.05 假定的标准差: 0.732
结果 样本 目标 差值 数量 功效 实际功效 0.1 47 0.9 0.903687 0.2 97 0.9 0.902206 0.3 321 0.9 0.900788

这些结果表明,当差值增加并接近等价限值时,需要使用较大的样本数量才能达到给定的功效。如果差值为 0.1,则至少需要 47 个观测值才能达到 0.9 的功效。如果差值为 0.3,则至少需要 321 个观测值才能达到 0.9 的功效。

功效

注意

本主题中的定义和解释适用于使用默认备择假设(下限 < 检验均值 - 目标值 < 上限)的标准等价检验。

等价检验的功效是指确实存在差值时,检验证实该差值在等价限值内的概率。等价检验的功效受检验的样本数量、差值、等价限值、数据变异性和显著性水平的影响。

有关更多信息,请转到等价检验的功效

解释

如果您输入了样本数量和差值,Minitab 将计算检验的功效。功效值 0.9 通常被认为已足够。如果功效为 0.9,则表示当总体差值实际上在等价限值内时,证实等价的概率为 90%。如果等价检验的功效较低,则即使总体均值和目标值是等价的,也可能无法证实等价。

如果您输入检验的差值和功效值,Minitab 将计算样本必须为多大。Minitab 还将计算该样本数量检验的实际功效。因为样本数量是整数,所以检验的实际功效可能比指定的功效值稍大。

通常,样本数量越少或者差值越接近等价限值时,检验得出等价结论的功效越低。

功效和样本数量

单样本等价检验 方法 差值的功效: 检验均值 - 目标值 原假设: 差值 ≤ -0.42 或差值 ≥ 0.42 备择假设: -0.42 < 差值 < 0.42 α 水平: 0.05 假定的标准差: 0.732
结果 样本 差值 数量 功效 0.1 20 0.516387 0.1 35 0.806390 0.2 20 0.341093 0.2 35 0.538352

在这些结果中,对于 0.1 的差值,样本数量为 20 时的检验功效大约为 0.52,而样本数量为 35 时的检验功效大约为 0.81。对于 0.2 的差值,样本数量为 20 时的检验功效大约为 0.34,而样本数量为 35 时的检验功效大约为 0.54。

功效曲线

功效曲线描绘了检验的功效与均值和目标之间差值的关系。

解释

使用功效曲线可以为您的检验评估合适的样本数量或功效。

功效曲线表示当显著性水平和标准差保持恒定时,每个样本数量的每个功效与差值组合。功效曲线上的每个符号都表示一个基于输入值的计算值。例如,如果您输入一个样本数量和一个功效值,Minitab 会计算相应的差值并将计算值显示在图形上。

检查曲线上的值,确定可以在特定功效值和样本数量处检测到的均值与目标之间的差值。通常认为功效值为 0.9 足矣。但是,有些从业者认为功效值为 0.8 足矣。如果假设检验的功效较低,则可能无法证明等价,即使均值与目标等价也是如此。如果增加样本数量,检验功效也会提高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。 通常,差值越接近等价限值,证明等价所需的功效越大。

在该图形中,样本数量 30 的功效曲线表明,对于任何大小差值都无法达到功效 0.9。样本数量 40 的功效曲线表明,对于大约为 0.0 的差值,检验的功效为 0.9。样本数量 100 的功效曲线表明,对于大约为 ±0.2 的差值,检验的功效为 0.9。对于每条曲线,当差值接近等价下限或等价上限时,检验的功效会降低并接近 α(alpha,即在不等价时声明等价的风险)。

使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策