2x2 交叉设计的等价检验 的效应

请查找定义和解释指导,了解在包含 2x2 交叉设计的等价检验的效应表中提供的值。

延滞效应

延滞统计量度量一个处理对下一个处理的效应。例如,假设参考处理产生较强的效应,检验处理产生较弱的效应。如果清除期不够长,则参考处理在期间 1 中的残留效应可能会导致检验处理在期间 2 中的效应看起来比实际效应强。

解释

将延滞效应的 p 值与显著性水平(用 alpha 或 α 表示)进行比较。α 通常为 0.05。如果 p 值小于 α,则延滞效应在统计意义上显著。在这种情况下,等价检验的结果可能会偏倚。

效应

效应SE自由度T 值P 值对等项的 95% CI
延滞0.451810.64988150.695210.498(-0.93339, 1.8370)
处理-0.321040.06064115-5.29410.000(-0.45030, -0.19179)
阶段-0.0977080.06064115-1.61120.128(-0.22696, 0.031546)

在这些结果中,估计的延滞效应为 0.45181。但是,p 值为 0.498,大于 α (0.05)。因此,延滞效应在统计意义上不显著。

重要信息

如果延滞效应或周期效应在统计意义上显著,则等价检验的结果可能不可靠。而且,处理效应可能与延滞效应和/或周期效应混在一起,这使得估计值具有不确定性。在使用 2x2 交叉设计时,应当在收集和分析数据之前仔细规划您的研究,以免出现延滞效应和周期效应。

处理效应

处理统计量度量检验处理效应和参考处理效应之间的差值。在大多数研究中,我们对处理效应很感兴趣。

解释

将处理效应的 p 值与显著性水平(用 alpha 或 α 表示)进行比较。α 通常为 0.05。如果 p 值小于 α,则处理效应在统计意义上显著。

效应

效应SE自由度T 值P 值对等项的 95% CI
延滞0.451810.64988150.695210.498(-0.93339, 1.8370)
处理-0.321040.06064115-5.29410.000(-0.45030, -0.19179)
阶段-0.0977080.06064115-1.61120.128(-0.22696, 0.031546)

在这些结果中,估计的处理效应为 −0.32104。处理效应的 p 值为 0.000,它小于 0.05。因此,在水平为 0.05 时,处理效应在统计意义上显著。显著的处理效应表示一种处理方法产生的效应优于另一种处理方法。但是,显著的处理效应并不意味着您无法声明等价。处理均值之间的差值可能仍位于等价限制内。

重要信息

如果延滞效应或周期效应在统计意义上显著,则等价检验的结果可能不可靠。而且,处理效应可能与延滞效应和/或周期效应混在一起,这使得估计值具有不确定性。在使用 2x2 交叉设计时,应当在收集和分析数据之前仔细规划您的研究,以免出现延滞效应和周期效应。

周期效应

期间统计量度量期间 1 中的响应与期间 2 中的响应之间的差值。例如,如果您度量血压作为响应,则可能会发现在期间 2 中响应降低只是因为参与者更习惯于检验环境和过程。因此,参与者的适应性可能会导致期间效应。

解释

将期间效应的 p 值与显著性水平(用 alpha 或 α 表示)进行比较。α 通常为 0.05。如果 p 值小于 α,则期间效应在统计意义上显著。在这种情况下,等价检验的结果可能会偏倚。

效应

效应SE自由度T 值P 值对等项的 95% CI
延滞0.451810.64988150.695210.498(-0.93339, 1.8370)
处理-0.321040.06064115-5.29410.000(-0.45030, -0.19179)
阶段-0.0977080.06064115-1.61120.128(-0.22696, 0.031546)

在这些结果中,估计的期间效应为 −0.097708。但是,p 值为 0.128,大于 alpha (0.05)。因此,期间效应在统计意义上不显著。

重要信息

如果延滞效应或周期效应在统计意义上显著,则等价检验的结果可能不可靠。而且,处理效应可能与延滞效应和/或周期效应混在一起,这使得估计值具有不确定性。在使用 2x2 交叉设计时,应当在收集和分析数据之前仔细规划您的研究,以免出现延滞效应和周期效应。

效应的标准误

每个效应的标准误估计样本效应之间的变异性,样本效应是对相同总体进行重复抽样而获得的。

解释

使用效应的标准误可以评估与随机抽样变异性相关的每个效应的估计值的精确度。通常,标准误越小,效应的估计值就越精确,它的置信区间也越窄。

将每个效应除以其标准误可计算效应的 t 值。标准误与效应的大小越不相关,t 值的绝对值越大。如果与该 t 值相关联的 p 值小于 alpha 水平,则可以得出效应在统计意义上显著的结论。有关详细信息,请转到与效应的 P 值有关的部分。

自由度

自由度 (DF) 指示数据提供的信息量,您可以使用这些信息来估计未知参数的值并计算这些估计值的变异性。

解释

Minitab 使用自由度计算检验统计量。 自由度受样本大小的影响。增加样本数量可提供有关总体的更多信息,从而增加自由度。

效应的 t 值

T 值是一种相对于样本的变异性(标准误)度量效应的量级的检验统计量。

解释

您可以使用 t 值来确定是否要否定原假设。但是,许多人使用 p 值或置信区间,因为它们更易于解释。

将每个效应除以其标准误可计算效应的 t 值。标准误的大小与效应的大小越不相关,t 值的绝对值就越大,否定原假设的证据也越充分。

每个效应的 t 值用于计算其相应的 p 值。如果与该 t 值相关联的 p 值小于显著性水平,则可以得出效应在统计意义上显著的结论。有关详细信息,请参见与效应的 P 值有关的部分。

效应的 p 值

P 值是一个概率,用来测量否定原假设的证据。概率越低,否定原假设的证据越充分。

对于 2x2 交叉设计的等价检验,Minitab 为延滞效应、周期效应和处理效应计算 p 值。

解释

使用每个效应的 p 值可以确定该效应在统计意义上是否显著。将每个 p 值与显著性水平(用 alpha 或 α 表示)进行比较。通常 α 为 .05 即可。

效应的 P 值
P 值 ≤ α:效应在统计意义上显著
如果 p 值小于 a,则可否定原假设并得出效应在统计意义上不同于 0 的结论。
P 值 > α:效应在统计意义上不显著
如果 p 值大于 α,则不能否定原假设。证据不足,无法得出效应在统计意义上显著的结论。

如果延滞效应或周期效应在统计意义上显著,则等价检验的结果可能不可靠。处理效应可能与周期效应和/或延滞效应混在一起。在使用 2x2 交叉设计时,应当在收集和分析数据之前仔细规划您的研究,以免出现延滞效应和周期效应。

如果延滞效应和周期效应在统计意义上不显著,请确定处理效应在统计意义上是否显著。通常,处理效应是需要关注的效应。

效应

效应SE自由度T 值P 值对等项的 95% CI
延滞0.451810.64988150.695210.498(-0.93339, 1.8370)
处理-0.321040.06064115-5.29410.000(-0.45030, -0.19179)
阶段-0.0977080.06064115-1.61120.128(-0.22696, 0.031546)

在这些结果中,延滞效应和周期效应的 p 值均大于 0.05(显著性水平)。因此,这些效应在统计意义上不显著。处理效应的 p 值小于 0.05,这表明处理之间的差值在统计意义上显著。

注意

在统计意义上显著的处理效应并不表明您无法声明等价。处理均值之间的差值可能仍位于等价限制内。使用等价图上的结果可以确定您能否声明等价。有关更多信息,请转到2x2 交叉设计的等价检验 的图形并单击“等价图”。

用于评估效应是否等价的置信区间 (CI)

等价置信区间基于样本数据为每个效应提供可能值的范围。

解释

对于每个效应,使用置信区间和 p 值可以确定该效应在统计意义上是否显著。

效应

效应SE自由度T 值P 值对等项的 95% CI
延滞0.451810.64988150.695210.498(-0.93339, 1.8370)
处理-0.321040.06064115-5.29410.000(-0.45030, -0.19179)
阶段-0.0977080.06064115-1.61120.128(-0.22696, 0.031546)

在这些结果中,延滞效应的 95% 置信区间为 (−0.93339, 1.8370),期间效应的 95% 置信区间为 (−0.22696, 0.031546)。但是,这两个效应在统计意义上都不显著 (p > 0.05)。处理效应的 95% 置信区间为 (−0.45030, −0.19179)。处理效应在统计意义上显著 (p = 0.000)。

重要信息

如果延滞效应或周期效应在统计意义上显著,则等价检验的结果可能不可靠。而且,处理效应可能与延滞效应和/或周期效应混在一起,这使得估计值具有不确定性。在使用 2x2 交叉设计时,应当在收集和分析数据之前仔细规划您的研究,以免出现延滞效应和周期效应。