2x2 交叉设计的等价检验检验

请查找定义和解释指导，了解 2x2 交叉设计的等价检验的检验表中提供的每个结果。

关于本主题

原假设和备择假设
α 水平
自由度
检验的 t 值
检验的 p 值

原假设和备择假设

原假设和备择假设对总体的陈述是互斥的。等价检验使用样本数据来确定是否要否定原假设。

原假设

Minitab 根据您选择的备择假设，检验下面的两个原假设中的一个或两个：

检验总体的均值与参考总体的均值之间的差值（或比值）大于或等于等价上限。
检验总体的均值与参考总体的均值之间的差值（或比值）小于或等于等价下限。

备择假设

备择假设声明下面的一项或两项：

检验总体的均值与参考总体的均值之间的差值（或比值）小于等价上限
检验总体的均值与参考总体的均值之间的差值（或比值）大于等价下限。

解释

使用原假设和备择假设可以验证等价标准是否正确，以及您是否选择了适合的备择假设进行检验。

检验

原假设:	差值 ≤ -0.5 或差值 ≥ 0.5
备择假设:	-0.5 < 差值 < 0.5
α 水平:	0.05

原假设	自由度	T 值	P 值
差值 ≤ -0.5	12	1.8637	0.044
差值 ≥ 0.5	12	-3.0566	0.005

在这些结果中，Minitab 检验两个有关检验总体的均值与参考总体的均值之间差值的原假设：1) 总体均值之间的差值小于或等于等价下限 −0.5；2) 总体均值之间的差值大于或等于等价上限 0.5。备择假设即总体均值之间的差值介于等价下限和等价上限之间（也就是说，检验总体的均值与参考总体的均值等价）。

α 水平

显著性水平（用 alpha 或 α 表示）是在原假设为真时否定原假设（类型 I 错误）的风险的最大可接受水平。例如，如果您使用默认假设执行等价检验，则 α 为 0.05 表示在实际上不等价时声明等价的风险为 5%。

等价检验的 α 水平还确定置信区间的置信水平。默认情况下，置信水平为 (1 – α) x 100%。如果您使用备择方法计算置信区间，则置信水平为 (1 – 2α) x 100%。

解释

使用 α 水平可以确定是否定还是无法否定原假设 (H₀)。

如果 p 值小于 α 水平，则否定 H₀ 并声明您的结果在统计意义上显著。

自由度

自由度 (DF) 指示数据提供的信息量，您可以使用这些信息来估计未知参数的值并计算这些估计值的变异性。

解释

Minitab 使用自由度计算检验统计量。自由度受样本大小的影响。增加样本数量可提供有关总体的更多信息，从而增加自由度。

检验的 t 值

检验统计量评估两个总体均值之间的差值相对于样本变异的大小。如果用检验均值和参考均值之间的差值表示等价标准，或者用对数正态变换表示检验均值/参考均值的比值，则 t 值用标准误的单位衡量样本参考均值和样本检验均值之间的差值。如果用检验均值和参考均值之间的比值表示等价标准，则 t 值衡量样本检验均值与参考均值的一部分之间的差值相对于这两个样本的变异的大小。

解释

您可以使用 t 值来确定是否要否定原假设。但是，许多人使用 p 值或置信区间，因为它们更易于解释。

通常，差值或比值相对于抽样变异性的量级越大，检验的 t 值的绝对值就越大，否定原假设的证据也越充分。

每个检验的 t 值用于计算其相应的 p 值。如果与该 t 值相关联的 p 值小于显著性水平，则否定原假设并得出结果在统计意义上显著的结论。有关详细信息，请参见与检验的 P 值有关的部分。

检验的 p 值

P 值是一个概率，用来测量否定原假设的证据。概率越低，否定原假设的证据越充分。

原假设取决于您为检验选择的备择假设。有关更多信息，请转到2x2 交叉设计的等价检验的假设。

解释

使用检验的 p 值可以确定是否有充分的证据来否定原假设并接受备择假设。将每个 p 值与显著性水平（也用 alpha 或 α 表示）进行比较。通常 α 为 0.05 即可。

在使用默认假设检验等价性时，Minitab 检验两个有关检验均值和参考均值之间差值（或比值）的原假设：1) 总体均值的差值（或比值）大于等价下限；2) 总体均值的差值（或比值）小于等价上限。

P 值 ≤ α：差值（或比值）在等价限值内: 如果 p 值小于或等于 α，可否定原假设并得出总体均值之间的差值（或比值）在等价限值内的结论。
P 值 > α：差值（或比值）不在等价限值内: 如果 p 值大于 α，则不能否定原假设。您的证据不足，无法得出总体均值之间的差值（或比值）在等价限值内的结论。

为了证明等价，这两个原假设的 p 值均必须低于 α 水平。如果任一检验的 p 值大于 α 水平，就不能声明等价。

提示

为了直观地评估等价检验的结果，请检查等价图上的结果，这比 p 值更便于解释。