使用原假设和备择假设可以验证等价标准是否正确,以及您是否选择了适合的备择假设进行检验。
原假设: | 差值 ≤ -0.5 或差值 ≥ 0.5 |
---|---|
备择假设: | -0.5 < 差值 < 0.5 |
α 水平: | 0.05 |
原假设 | 自由度 | T 值 | P 值 |
---|---|---|---|
差值 ≤ -0.5 | 12 | 1.8637 | 0.044 |
差值 ≥ 0.5 | 12 | -3.0566 | 0.005 |
在这些结果中,Minitab 检验两个有关检验总体的均值与参考总体的均值之间差值的原假设:1) 总体均值之间的差值小于或等于等价下限 −0.5;2) 总体均值之间的差值大于或等于等价上限 0.5。备择假设即总体均值之间的差值介于等价下限和等价上限之间(也就是说,检验总体的均值与参考总体的均值等价)。
显著性水平(用 alpha 或 α 表示)是在原假设为真时否定原假设(类型 I 错误)的风险的最大可接受水平。例如,如果您使用默认假设执行等价检验,则 α 为 0.05 表示在实际上不等价时声明等价的风险为 5%。
等价检验的 α 水平还确定置信区间的置信水平。默认情况下,置信水平为 (1 – α) x 100%。如果您使用备择方法计算置信区间,则置信水平为 (1 – 2α) x 100%。
使用 α 水平可以确定是否定还是无法否定原假设 (H0)。
如果 p 值小于 α 水平,则否定 H0 并声明您的结果在统计意义上显著。
自由度 (DF) 指示数据提供的信息量,您可以使用这些信息来估计未知参数的值并计算这些估计值的变异性。
如果您未假定等方差,则双样本等价检验的自由度由标准差和样本大小来确定。如果您假定等方差,则总自由度仅由样本大小确定(样本大小之和减去 2)。
Minitab 使用自由度计算检验统计量。
自由度受样本大小的影响。增加样本数量可提供有关总体的更多信息,从而增加自由度。
检验统计量评估两个总体均值之间的差值相对于样本变异的大小。如果用检验均值和参考均值之间的差值表示等价标准,或者用对数正态变换表示检验均值/参考均值的比值,则 t 值用标准误的单位衡量样本参考均值和样本检验均值之间的差值。如果用检验均值和参考均值之间的比值表示等价标准,则 t 值衡量样本检验均值与参考均值的一部分之间的差值相对于这两个样本的变异的大小。
您可以使用 t 值来确定是否要否定原假设。但是,许多人使用 p 值或置信区间,因为它们更易于解释。
通常,差值或比值相对于抽样变异性的量级越大,检验的 t 值的绝对值就越大,否定原假设的证据也越充分。
对于每个检验,Minitab 使用 t 值计算 p 值。
P 值是一个概率,用来测量否定原假设的证据。概率越低,否定原假设的证据越充分。
使用 p 值可以确定您是否有足够的证据否定有关检验总体的均值与参考总体的均值之间差值(或比值)的如下原假设:1) 差值(或比值)大于等价下限(非劣势);2) 差值(或比值)小于等价上限(非优势)。默认情况下,等价检验对这两个原假设进行检验并包括每个检验的 p 值。
对于每个原假设,将 p 值与检验的显著性水平(用 alpha 或 α 表示)进行比较。α 通常为 0.05。
为了直观地评估等价检验的结果,请检查等价图上的结果,这比 p 值更便于解释。