显著性水平(用 alpha 或 α 表示)是在原假设为真时否定原假设(I 型错误)的风险的最大可接受水平。Alpha 还解释为当原假设 (H0) 为真时检验的功效。在分析数据之前通常会选择显著性水平。默认的显著性水平为 0.05。
使用显著性水平可以在原假设 (H0) 为真时最小化检验的功效值。显著性水平越高,检验功效越大,犯 I 型错误(否定原本为真的原假设)的概率越大。
观测值长度表示每个观测期间的数量级、持续时间或大小。
使用观测值长度可以将发生率转换为最适合您的情形的形式。
例如,如果每个样本观测值对每年的活动数量进行计数,则长度为 1 表示每年的发生率,而长度为 12 则表示每月的发生率。
比较率是要与基线率比较的值。
Minitab 计算比较率。对于每个样本数量来说,比较率与基线率之间的差值是可帮助其达到指定功效水平的最小差值。样本数量越大,检验能够检测到的差值越小。您希望检测对于您的应用有实际意义的最小差值。
使用功效曲线可以更完整地研究在给定功效下样本数量和比较率之间的关系。
样本数量是样本中的观测值总数。
使用样本数量可以估计在特定差值下,假设检验取得特定功效值所需的观测值个数。
Minitab 计算样本必须为多大,具有指定功效的检验才能检测到基线率与比较率之间的差值。因为样本数量是整数,所以检验的实际功效可能比指定的功效值稍大。
样本数量越大,检验功效也会越高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。
使用功效曲线可以更完整地研究在给定功效下样本数量和差值之间的关系。
假设检验的功效是指检验正确否定原假设的概率。假设检验的功效受检验的样本数量、差值、数据变异性和显著性水平的影响。
有关更多信息,请转到什么是功效?。
Minitab 根据指定的比较率和样本数量计算检验的功效。功效值 0.9 通常被认为已足够。如果值为 0.9,则表示当差值确实存在时,检测到总体率之差的概率为 90%。如果检验的功效较低,您可能无法检测到差值并错误地得出不存在任何差值的结论。通常,样本数量越少或差值越小时,检验检测到差值的功效越低。
如果您输入检验的比较率和功效值,Minitab 将计算样本必须为多大。Minitab 还将计算该样本数量检验的实际功效。因为样本数量是整数,所以检验的实际功效可能比指定的功效值稍大。
功效曲线描绘了检验的功效与比较率之间的关系。
使用功效曲线可以为您的检验评估合适的样本数量或功效。
功效曲线表示当显著性水平保持恒定时,每个样本数量的每个功效与比较率组合。功效曲线上的每个符号都表示一个基于输入值的计算值。例如,如果您输入一个样本数量和一个功效值,Minitab 会计算相应的比较比率并将计算值显示在图形上。
检查曲线上的值,确定可以在特定功效值和样本数量处检测到的比较率与基线率之间的差值。通常认为功效值为 0.9 足矣。但是,有些从业者认为功效值为 0.8 足矣。如果假设检验的功效较低,则可能无法检测到实际上有显著意义的差值。如果增加样本数量,检验功效也会提高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。如果您减小要检测的差值,则功效也会降低。
在此图形中,功效曲线表明,要以 0.9 的功效检测比较率 32,样本数量需要为 79。要以 0.9 的功效检测比较率 38,样本数量需要为 86。当比较率接近基线率(在此图形中为 35)时,检验的功效会降低并接近 α(又称为显著性水平),在该分析中 α 为 0.05。