显著性水平(用 alpha 或 α 表示)是在原假设为真时否定原假设(1 型错误)的风险的最大可接受水平。例如,如果您使用默认假设执行单因子方差分析,则 α 为 0.05 表示当差值实际上不存在时,得出差值存在的风险为 5%。
使用显著性水平可以在原假设 (H0) 为真时最小化检验的功效值。显著性水平越高,检验功效越大,犯 I 型错误(否定原本为真的原假设)的概率越大。
标准差是离差的最常用度量,即数据与均值的接近程度。对某一过程而言随机或合乎自然规律的变异通常称为噪声。
最大差值是最小组均值和最大组均值间的差值。
如果您输入样本数量和功效,Minitab 将计算最大差值。通常,样本数量越大,用指定功效检测到的最大差值越小。
使用功效曲线可以更完整地研究样本数量与可以检测到的差值之间的关系。
样本数量 | 功效 | 最大差值 |
---|---|---|
5 | 0.9 | 4.42404 |
7 | 0.9 | 3.58435 |
9 | 0.9 | 3.09574 |
单因子方差分析的功效是当组均值之间实际存在差异时,检验确定二者之间的最大差值在统计上显著的概率。
如果您输入了最大差值和样本数量,Minitab 将计算检验的功效。功效值 0.9 通常被认为已足够。如果值为 0.9,则表示当总体中确实存在至少两个均值的差值时,检测到该差值的概率为 90%。如果检验的功效较低,您可能无法检测到差值并错误地得出不存在任何差值的结论。通常情况下,样本数量越少或差值越小时,检验检测到差值的功效就越低。
例如,在下面的结果中,对于最大差值 6,样本数量 4 提供大约为 0.9 的功效,但是对于最大差值 4,仅提供 0.69 的功效。在每个最大差值处,增加样本数量将提高检验功效。
最大差值 | 样本数量 | 功效 |
---|---|---|
2 | 4 | 0.206970 |
2 | 6 | 0.332203 |
2 | 8 | 0.454971 |
4 | 4 | 0.688630 |
4 | 6 | 0.909626 |
4 | 8 | 0.978713 |
6 | 4 | 0.968086 |
6 | 6 | 0.999226 |
6 | 8 | 0.999988 |
功效曲线描绘了检验的功效与最小均值和最大均值之间最大差值之间的关系。
使用功效曲线可以为您的检验评估合适的样本数量或功效。
功效曲线表示当显著性水平和标准差保持恒定时,每个样本数量的每个功效与最大差值组合。功效曲线上的每个符号都表示一个基于您为两个属性所输入值的计算值。例如,如果您输入样本数量和功效值,Minitab 将计算相应的最大差值并将该值显示在图形上。
检查曲线上的值,确定该检验可以在特定功效和样本数量处检测到的最大差值。通常认为功效值为 0.9 足矣。但是,有些从业者认为功效值为 0.8 足矣。如果单因子方差分析的功效较低,则可能无法在最小均值和最大均值之间检测到实际上存在的差值。
样本数量越大,检验功效也会越高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。
在该图形中,每个样本数量都对应一条曲线。样本数量 5(在每个组中)的功效曲线表明,对于最大差值 4,检验的功效大约为 0.8。样本数量 7 的功效曲线表明,对于最大差值 4,检验的功效大约为 0.95。样本数量 9 的功效曲线表明,对于最大差值 4,检验的功效接近 1.0。对于每条样本数量曲线,最大差值越大,功效也越高。
样本数量是样本中的观测值总数。
如果您输入功效和最大差值,Minitab 将计算样本必须为多大。样本数量指每个组中的观测值个数。因为样本数量是整数,所以检验的实际功效可能比指定的功效值稍大。
样本数量越大,检验功效也会越高。您希望样本中有足够的观测值以达到足够的功效。但是,您不希望样本数量过大,让您在不必要的抽样上浪费时间和金钱或者检测在统计意义上显著但不重要的差值。
例如,下面的结果表明,对于最大差值 4,样本数量越大,功效越大。每个组中的样本数量 5 将得到大约为 0.83 的实际功效,样本数量 6 将得到大约为 0.91 的实际功效。
最大差值 | 样本数量 | 目标功效 | 实际功效 |
---|---|---|---|
4 | 5 | 0.8 | 0.826860 |
4 | 6 | 0.9 | 0.909626 |