显著性水平(用 alpha 或 α 表示)是在原假设为真时否定原假设(I 型错误)的风险的最大可接受水平。Alpha 还解释为当原假设 (H0) 为真时检验的功效。在分析数据之前通常会选择显著性水平。默认的显著性水平为 0.05。
使用显著性水平可以在原假设 (H0) 为真时最小化检验的功效值。显著性水平越高,检验功效越大,犯 I 型错误(否定原本为真的原假设)的概率越大。
标准差是离差的最常用度量,即数据与均值的接近程度。对某一过程而言随机或合乎自然规律的变异通常称为噪声。
此值表示配对观测值的总体均值之间的差值。
Minitab 为每个样本数量计算可帮助其达到指定功效水平的最小差值。样本数量越大,检验能够检测到的差值越小。您希望检测对于您的应用有实际意义的最小差值。
使用功效曲线可以更完整地研究在给定功效下样本数量和差值之间的关系。
样本数量是样本中的观测值总数。
使用样本数量可以估计在特定差值下,假设检验取得特定功效值所需的观测值个数。
Minitab 计算样本必须为多大,具有指定功效的检验才能检测到每个指定的差值。因为样本数量是整数,所以检验的实际功效可能比指定的功效值稍大。
样本数量越大,检验功效也会越高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。
使用功效曲线可以更完整地研究在给定功效下样本数量和差值之间的关系。
假设检验的功效是指检验正确否定原假设的概率。假设检验的功效受检验的样本数量、差值、数据变异性和显著性水平的影响。
有关更多信息,请转到什么是功效?。
Minitab 根据指定的差值和样本数量计算检验的功效。功效值 0.9 通常被认为已足够。如果值为 0.9,则表示当差值确实存在时,检测到总体配对均值之差的概率为 90%。如果检验的功效较低,您可能无法检测到差值并错误地得出不存在任何差值的结论。通常,样本数量越少或差值越小时,检验检测到差值的功效越低。
如果您输入检验的差值和功效值,Minitab 将计算样本必须为多大。Minitab 还将计算该样本数量检验的实际功效。因为样本数量是整数,所以检验的实际功效可能比指定的功效值稍大。
功效曲线描绘了检验的功效与配对均值之间差值的关系。
使用功效曲线可以为您的检验评估合适的样本数量或功效。
功效曲线表示当显著性水平和标准差保持恒定时,每个样本数量的每个功效与差值组合。功效曲线上的每个符号都表示一个基于输入值的计算值。例如,如果您输入一个样本数量和一个功效值,Minitab 会计算相应的差值并将计算值显示在图形上。
检查曲线上的值,确定可以在特定功效值和样本数量处检测到的配对均值之间的差值。通常认为功效值为 0.9 足矣。但是,有些从业者认为功效值为 0.8 足矣。如果假设检验的功效较低,则可能无法检测到实际上有显著意义的差值。如果增加样本数量,检验功效也会提高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。 如果您减小要检测的差值,则功效也会降低。
在此图形中,样本数量 10 的功效曲线表明,对于差值 5,检验功效为 0.8。样本数量 20 和 50 的功效曲线表明,对于差值 5,检验功效与 1 非常接近。因为这些功效值非常高,所以如果您收集 20 或更多个样本,则可能会在不必要的抽样上浪费时间和金钱。