原假设和备择假设是针对总体的互斥声明。等价检验使用样本数据来确定是否要否定原假设。
H0:Δ ≤ δ1 | 检验总体的均值与目标之间的差值 (Δ) 小于或等于等价下限 (δ1)。 |
H0:Δ ≥ δ2 | 检验总体的均值与目标之间的差值 (Δ) 大于或等于等价上限 (δ2)。 |
H1:δ1< Δ < δ2 | 检验总体的均值与目标值之间的差值 (Δ) 大于等价下限 (δ1) 且小于等价上限 (δ2)。 |
通过在执行检验时选择一个不同的备择假设,还可以评估另外一组假设。有关更多信息,请转到单样本等价检验 的假设。
使用原假设和备择假设可以验证等价标准是否正确,以及您是否选择了适合的备择假设进行检验。
原假设: | 差值 ≤ -0.42 或差值 ≥ 0.42 |
---|---|
备择假设: | -0.42 < 差值 < 0.42 |
α 水平: | 0.05 |
原假设 | 自由度 | T 值 | P 值 |
---|---|---|---|
差值 ≤ -0.42 | 27 | 5.0972 | 0.000 |
差值 ≥ 0.42 | 27 | -0.97605 | 0.169 |
在这些结果中,Minitab 检验两个原假设:1) 总体均值与目标之间的差值小于或等于等价下限 −0.42;2) 总体均值与目标之间的差值大于或等于等价上限 0.42。备择假设即总体均值与目标之间的差值介于等价下限和等价上限之间(也就是说,总体均值等于目标)。
显著性水平(用 alpha 或 α 表示)是在原假设为真时否定原假设(类型 I 错误)的风险的最大可接受水平。例如,如果您使用默认假设执行等价检验,则 α 为 0.05 表示在实际上不等价时声明等价的风险为 5%。
等价检验的 α 水平还确定置信区间的置信水平。默认情况下,置信水平为 (1 – α) x 100%。如果您使用备择方法计算置信区间,则置信水平为 (1 – 2α) x 100%。
使用 α 水平可以确定是否定还是无法否定原假设 (H0)。
如果 p 值小于 α 水平,则否定 H0 并声明您的结果在统计意义上显著。
自由度 (DF) 指示数据提供的信息量,您可以使用这些信息来估计未知参数的值并计算这些估计值的变异性。
对于单样本等价检验,总自由度是样本中的观测值个数减去 1 (n – 1)。
Minitab 使用自由度计算检验统计量。 自由度受样本大小的影响。增加样本数量可提供有关总体的更多信息,从而增加自由度。
T 值是 t 检验统计量的观测值,它以标准误的单位来度量观测样本的统计量与其假设的总体参数之差。
您可以使用 t 值来确定是否要否定原假设。但是,许多人使用 p 值或置信区间,因为它们更易于解释。
通常,差值相对于随机抽样变异性的量级越大,检验的 t 值的绝对值就越大,否定原假设的证据也越充分。
检验的 t 值用于计算相应的 p 值。如果 p 值小于显著性水平,则否定原假设并得出结果在统计意义上显著的结论。有关详细信息,请参见有关 P 值和决策的部分。
P 值是一个概率,用来测量否定原假设的证据。概率越低,否定原假设的证据越充分。
使用 p 值可以确定您是否有足够的证据否定有关总体均值与目标之间差值的如下原假设:1) 差值大于等价下限(非劣势);2) 差值小于等价上限(非优势)。默认情况下,等价检验对这两个原假设进行检验并包括每个检验的 p 值。
对于每个原假设,将 p 值与检验的显著性水平(用 alpha 或 α 表示)进行比较。α 通常为 0.05。
为了直观地评估等价检验的结果,请检查等价图上的结果,这比 p 值更便于解释。