解释 2x2 交叉设计等价检验的功效和样本数量的所有统计量和图形

请查找定义和解释指导，了解随 2x2 交叉设计等价检验的功效和样本数量提供的每个统计量和图形。

关于本主题

差值的功效
比值的功效
原假设和备择假设
α (alpha)
假定的对象内标准差
假定的对象内变异系数
差值
比值
样本数量
功效
功效曲线

差值的功效

第一行输出指示为等价检验指定假设的方式。

“差值的功效”指示假设是用检验总体的均值与参考总体的均值之间的差值（检验均值 – 参考均值）来指定的。

比值的功效

第一行输出指示为等价检验指定假设的方式。

“比值的功效”指示假设是用检验总体的均值与参考总体的均值之间的比值（检验均值/参考均值，用对数变换表示）来指定的。

原假设和备择假设

原假设和备择假设是针对总体的互斥声明。等价检验使用样本数据来确定是否要拒绝原假设。

原假设

Minitab 根据您选择的备择假设，检验下面的两个原假设中的一个或两个：

检验总体的均值与参考总体的均值之间的差值（或比值）大于或等于等价上限。
检验总体的均值与参考总体的均值之间的差值（或比值）小于或等于等价下限。

备择假设

备择假设声明下面的一项或两项：

检验总体的均值与参考总体的均值之间的差值（或比值）小于等价上限。
检验总体的均值与参考总体的均值之间的差值（或比值）大于等价下限。

解释

使用原假设和备择假设可以验证等价标准是否正确，以及您是否选择了适合的备择假设进行检验。

方法

差值的功效:	检验均值 - 参考均值
原假设:	差值 ≤ -0.425 或差值 ≥ 0.425
备择假设:	-0.425 < 差值 < 0.425
α 水平:	0.05

在这些结果中，Minitab 检验两个原假设：

检验总体的均值与参考总体的均值之间的差值小于或等于等价下限 −0.425。
检验总体的均值与参考总体的均值之间的差值大于或等于等价上限 0.425。

α (alpha)

显著性水平（用 alpha 或 α 表示）是在原假设为真时否定原假设（I 型错误）所带来风险的最大可接受水平。例如，如果您使用默认假设执行等价检验，则 α 为 0.05 表示当检验均值与参考均值之间的差值实际上不在等价限值范围内时，声明二者等价的风险为 5%。

等价检验的 α 水平还确定等价区间的置信水平。默认情况下，置信水平为 (1 – α) x 100%。如果您使用备择方法计算置信区间，则置信水平为 (1 – 2α) x 100%。

解释

使用显著性水平可以在原假设 (H₀) 为真时最小化检验的功效值。显著性水平越高，检验功效越大，犯 I 型错误（否定原本为真的原假设）的概率越大。

假定的对象内标准差

对象内标准差是同一个参与者的多个响应值的标准差。此标准差度量估计在消除了处理效应、周期效应和其他系统性效应之后，同一个参与者的响应测量值中随机错误的数量级。值越高，每个参与者的响应值中的变异性越大。

解释

如果您对有关差值的等价检验执行功效分析，则必须输入对象内标准差。此假定的对象内标准差是总体标准差的估计值。

Minitab 使用假定的对象内标准差计算检验的功效。对象内标准差的值越大，数据中的变异性或“噪声”越大，检验的统计功效越低。

假定的对象内变异系数

对象内变异系数是同一个参与者的多个响应值的变异系数。变异系数等于标准差除以均值。

此变异性度量估计在消除了处理效应、周期效应和其他系统性效应之后，同一个参与者的响应测量值中随机错误的数量级。值越高，每个参与者的响应值中的变异性越大。

解释

如果您对有关比值的等价检验执行功效分析，则必须输入对象内变异系数。此假定的对象内变异系数是总体变异系数的估计值。

Minitab 使用假定的对象内变异系数来计算检验功效。对象内变异系数的值越高，数据中的变异性或“噪声”越大，检验的统计功效越低。

差值

此值表示检验总体的均值与参考总体的均值之间的差值。

注意

本主题中的定义和解释适用于使用默认备择假设（下限 < 检验均值 - 参考均值 < 上限）的标准等价检验。

解释

如果您输入检验的样本数量和功效，则 Minitab 将计算检验在指定功效和样本数量下可接受的差值。样本数量越大，差值越接近等价限值。

使用功效曲线可以更完整地研究样本数量与检验在给定功效下可接受的差值之间的关系。

方法

差值的功效:	检验均值 - 参考均值
原假设:	差值 ≤ -0.425 或差值 ≥ 0.425
备择假设:	-0.425 < 差值 < 0.425
α 水平:	0.05

结果

样本数量	功效	差值
4	0.9	-0.278474
4	0.9	0.278474
8	0.9	-0.329164
8	0.9	0.329164
12	0.9	-0.348248
12	0.9	0.348248

这些结果表明，样本数量越大，在给定功效水平下可接受的差值也越大：

如果每个序列中有 4 名参与者，则当差值大约在 −0.278 和 0.278 之间时，检验功效至少为 0.9。
如果每个序列中有 8 名参与者，则当差值大约在 −0.329 和 0.329 之间时，检验功效至少为 0.9。
如果每个序列中有 12 名参与者，则当差值大约在 −0.348 和 0.348 之间时，检验功效至少为 0.9。

比值

此值表示检验总体的均值与参考总体的均值之间的比值。要为比值执行功效计算，您必须选择一个有关检验均值 / 参考均值 (比值，通过对数变换)的假设。

注意

本主题中的定义和解释适用于使用针对比值的默认备择假设（下限 < 检验均值 / 参考均值 < 上限）的等价检验。

解释

如果您输入检验的样本数量和功效，则 Minitab 将计算检验在指定功效和样本数量下可接受的最小比值和最大比值。样本数量越大，比值越接近等价限值。

使用功效曲线可以更完整地研究样本数量与检验在给定功效下可接受的比值之间的关系。

方法

比值功效:	检验均值 / 参考均值
原假设:	比值 ≤ 0.9 或比值 ≥ 1.1
备择假设:	0.9 < 比值 < 1.1
α 水平:	0.05

结果

样本数量	功效	比值
10	0.9	0.91749
10	0.9	1.07903
20	0.9	0.91207
20	0.9	1.08544

这些结果表明样本数量越大，检验在给定功效水平下可接受的比值范围越大：

如果每个序列中有 10 个观测值，当比值大约介于 0.92 和 1.08 之间时，检验的功效至少为 0.9。
如果每个序列中有 20 个观测值，当比值大约介于 0.91 和 1.09 之间时，检验的功效至少为 0.9。

样本数量

样本数量是样本中的观测值总数。对于 2x2 交叉研究，样本数量是指研究的每个序列中参与者的数量。

解释

使用样本数量可以估计在特定差值下，等价检验取得特定功效值所需的观测值个数。

如果您输入检验的差值（或比值）和功效值，Minitab 将计算样本必须为多大。因为样本数量是整数，所以检验的实际功效可能比指定的功效值稍大。

样本数量越大，检验功效也会越高。您希望样本中有足够的观测值以达到足够的功效。但是，您不希望样本数量过大，让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。

使用功效曲线可以更完整地研究样本数量与检验在给定功效下可接受的差值（或比值）之间的关系。

方法

差值的功效:	检验均值 - 参考均值
原假设:	差值 ≤ -0.425 或差值 ≥ 0.425
备择假设:	-0.425 < 差值 < 0.425
α 水平:	0.05

结果

差值	样本数量	目标功效	实际功效
0.0	2	0.9	0.978589
0.1	2	0.9	0.931544
0.2	3	0.9	0.972795
0.3	6	0.9	0.943646
0.4	107	0.9	0.900500

这些结果表明，当差值增加到接近等价限值时，需要使用较大的样本数量来达到给定的功效。如果差值为 0.1，则每个序列中仅需要 2 名参与者即可达到功效 0.9。如果差值为 0.4，则每个序列中至少需要 107 名参与者才能达到功效 0.9。

功效

等价检验的功效是指确实存在差值时，检验证实该差值在等价限值内的概率。等价检验的功效受检验的样本数量、差值、等价限值、数据变异性和显著性水平的影响。

有关更多信息，请转到等价检验的功效。

解释

如果您输入样本数量和差值（或比值），Minitab 会计算检验的功效。功效值 0.9 通常被认为已足够。如果功效为 0.9，则表示当总体均值的差值（或比值）实际位于等价限值内时，证实等价的概率为 90%。如果等价检验的功效较低，您可能无法证实等价，即使在检验均值和参考均值相等时也是如此。

通常情况下，样本数量越小或者差值（或比值）越接近等价限值时，检验得出等价结论的功效就越低。

方法

差值的功效:	检验均值 - 参考均值
原假设:	差值 ≤ -0.425 或差值 ≥ 0.425
备择假设:	-0.425 < 差值 < 0.425
α 水平:	0.05

结果

差值	样本数量	功效
0.3	8	0.984946
0.3	12	0.999089
0.4	8	0.189487
0.4	12	0.244815

在这些结果中，对于差值 0.3，样本数量为 8 时检验的功效大约为 0.98，样本数量为 15 时功效大约为 0.99。对于差值 0.4，样本数量为 8 时功效大约为 0.19，样本数量为 12 时功效大约为 0.24。

功效曲线

功效曲线描绘了检验的功效与检验均值和参考均值之间差值的关系。

解释

使用功效曲线可以为您的检验评估合适的样本数量或功效。

功效曲线表示当显著性水平和标准差（或方差系数）保持恒定时，每个样本数量的每个功效与差值（或比值）组合。功效曲线上的每个符号都表示一个基于输入值的计算值。例如，如果您输入一个样本数量和一个功效值，Minitab 会计算相应的差值（或比值）并将计算值显示在图形上。

检查曲线上的值，确定可以在特定功效值和样本数量处接受的检验均值与参考均值之间的差值（或比值）。通常认为功效值为 0.9 足矣。但是，有些从业者认为功效值为 0.8 足矣。如果假设检验的功效较低，则可能无法证明等价，即使总体均值等价也是如此。如果增加样本数量，检验功效也会提高。您希望样本中有足够的观测值以达到足够的功效。但是，您不希望样本数量过大，让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。通常，差值（或比值）越接近等价限值，证明等价所需的功效越大。

在该图形中，所有样本数量的功效曲线表明，对于大约 ±0.25 的差值，检验具有足够大的功效 (≥ 0.9)。样本数量指每个序列中参与者的数量。样本数量为 4 的功效曲线表明，对于大约 ±0.28 的差值，检验的功效为 0.9。样本数量为 12 的功效曲线表明，对于大约 ±0.33 的差值，检验的功效为 0.9。请注意，将样本数量增加到 12 只会将功效 0.9 处可以接受的差值稍微增加一点。对于每条曲线，当差值接近等价下限或等价上限时，检验的功效会降低并接近 α（alpha，即在不等价时声明等价的风险）。

解释 2x2 交叉设计等价检验的功效和样本数量 的所有统计量和图形