解释 2x2 交叉设计等价检验的功效和样本数量 的主要结果

通过完成以下步骤来解释 2x2 交叉设计等价检验的功效和样本数量。主要输出包括差值、样本数量、功效和功效曲线。

步骤 1:检查计算值

Minitab 使用您为两个属性输入的值,计算检验的差值、样本数量或功效。

差值(或比值)
如果您输入检验的样本数量和功效,则 Minitab 将计算检验在指定功效和样本数量下可接受的差值(或比值)。样本数量越大,差值(或比值)越接近等价限值。 此值表示检验总体的均值与参考总体的均值之间的差值(或比值)。
样本数量
如果您输入检验的差值和功效值,Minitab 将计算样本必须为多大。 样本数量越大,检验功效也会越高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。
注意

因为样本数量是整数,所以检验的实际功效可能比指定的功效值稍大。

功效
如果您输入样本数量和差值(或比值),Minitab 会计算检验的功效。功效值 0.9 通常被认为已足够。如果功效为 0.9,则表示当总体均值的差值(或比值)实际位于等价限值内时,证实等价的概率为 90%。如果等价检验的功效较低,您可能无法证实等价,即使在检验均值和参考均值相等时也是如此。 通常,样本数量越少或者差值越接近等价限值时,检验得出等价结论的功效越低。
注意

本主题中的定义和解释适用于使用默认备择假设(下限 < 检验均值 - 参考均值 < 上限)的标准等价检验。

方法

差值的功效: 检验均值 - 参考均值
原假设:差值 ≤ -0.45 或差值 ≥ 0.45
备择假设:-0.45 < 差值 < 0.45
α 水平:0.05
假定的主题组内标准差 = 0.088

结果

差值样本数量功效
0.4120.603466
样本数量是指每个序列的。
主要结果:差值、样本数量和功效

这些结果表明,如果每个序列中的样本数量为 12,差值为 0.4,则为了证明等价而所需的检验功效大约为 0.6。由于检验的功效不够大,无法接受差值 0.4,因此您应当尽可能增加样本数量。您还可以使用功效曲线来确定检验使用哪个差值可在指定的样本数量下达到足够大的功效 (0.9)。

步骤 2:检查功效曲线

使用功效曲线可以为您的检验评估合适的样本数量或功效。

功效曲线表示当显著性水平和标准差(或方差系数)保持恒定时,每个样本数量的每个功效与差值(或比值)组合。功效曲线上的每个符号都表示一个基于输入值的计算值。例如,如果您输入一个样本数量和一个功效值,Minitab 会计算相应的差值(或比值)并将计算值显示在图形上。

检查曲线上的值,确定可以在特定功效值和样本数量处接受的检验均值与参考均值之间的差值(或比值)。通常认为功效值为 0.9 足矣。但是,有些从业者认为功效值为 0.8 足矣。如果假设检验的功效较低,则可能无法证明等价,即使总体均值等价也是如此。如果增加样本数量,检验功效也会提高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。 通常,差值(或比值)越接近等价限值,证明等价所需的功效越大。

在此图形中,所有样本数量的功效曲线表明,对于大约 ±0.25 的差值,检验具有足够大的功效 (≥ 0.9)。样本数量是指每个序列中参与者的数量。样本数量 4 的功效曲线表明,对于大约 ±0.28 的差值,检验的功效为 0.9。样本数量 12 的功效曲线表明,对于大约 ±0.33 的差值,检验的功效为 0.9。请注意,将样本数量增加到 12 只会将功效 0.9 处可以接受的差值稍微增加一点。对于每条曲线,当差值接近等价下限或等价上限时,检验的功效会降低并接近 α(alpha,即在不等价时声明等价的风险)。