2x2 交叉设计的等价检验 示例

一家消费者保健公司的质量工程师想要确定普通抗酸药与名牌抗酸药是否等价。有两组参与者,在前 5 天他们服用一种抗酸药,接着是两周的清除期,在之后的 5 天服用另一种抗酸药。组 1 先服用普通抗酸药(检验处理),后服用名牌抗酸药(参考处理)。组 2 先服用名牌抗酸药,后服用普通抗酸药。工程师在每次处理的最后一天测量胃部 pH 值。由于 pH 值越低酸性越大,因此值越大表示药物越有效。如果检验 pH 值在参考 pH 值的 10% 范围内,工程师会将这两种抗酸药视为等价。

工程师执行 2x2 交叉设计的等价检验,以确定检验 pH 值是否在参考 pH 值的 10% 范围内。

  1. 打开样本数据,胃酸.MTW
  2. 选择统计 > 等价检验 > 2x2 交叉设计
  3. 从下拉列表中,选择两个序列的数据未堆叠
  4. 序列 1 的处理顺序中,选择检验,参考
  5. 序列 1,阶段 1中,输入组 1,通用。在序列 1,阶段 2中,输入组 1,品牌
  6. 序列 2,阶段 1中,输入组 2,品牌。在序列 2,阶段 2中,输入组 2,通用
  7. 相关假设中,选择检验均值 - 参考均值
  8. 您要确定什么? (备择假设)中,选择下限 < 检验均值 - 参考均值 < 上限
  9. 下限中,输入 –0.1
  10. 上限中,输入 0.1
  11. 选择乘以参考均值
  12. 单击选项
  13. 参考处理的标签中,键入名牌。在检验处理的标签中,键入通用
  14. 在每个对话框中单击确定

解释结果

重要信息

如果延滞效应或期间效应显著,则等价检验的结果可能不可靠。

延滞效应的 p 值 (0.498) 和期间效应的 p 值 (0.128) 均大于 0.05。因此,这些效应在水平为 0.05 时不显著。

处理效应的 p 值 (0.000) 小于 0.05。因此,处理效应在水平为 0.05 时显著。显著的处理效应表示,在增加胃的 pH 值方面,一种解酸剂好于另一种。通用解酸剂不会像名牌解酸剂那样增加胃的 pH 值。在使用通用解酸剂之后,胃的平均 pH 值大约比使用名牌解酸剂之后的平均 pH 值小 0.321。

等价置信区间 (−0.42735, 0) 的一部分落在等价区间 (−0.42503, 0.42503) 之外。因此,工程师不能断言两种解酸剂在减少胃酸方面等效。

方法

序列 1 中受试者的处理顺序: 通用, 品牌
序列 2 中受试者的处理顺序: 品牌, 通用
等价下限 = -0.1 × 样本参考均值 = -0.42503
等价上限 = 0.1 × 样本参考均值 = 0.42503

描述性统计量



阶段 1阶段 2
序列N均值标准差均值标准差
194.09110.686414.31440.63677
284.18620.741103.76750.65741
主题组内标准差 = 0.08825

效应

效应SE自由度T 值P 值对等项的 95% CI
延滞0.451810.64988150.695210.498(-0.93339, 1.8370)
处理-0.321040.06064115-5.29410.000(-0.45030, -0.19179)
阶段-0.0977080.06064115-1.61120.128(-0.22696, 0.031546)

差值: 均值(通用) - 均值(品牌)

差值SE对等项的 95% CI等价区间
-0.321040.060641(-0.427349, 0)(-0.425035, 0.425035)
置信区间不在等价区间内。不能认为是等价。

检验

原假设:差值 ≤ -0.42503 或差值 ≥ 0.42503
备择假设:-0.42503 < 差值 < 0.42503
α 水平:0.05
原假设自由度T 值P 值
差值 ≤ -0.42503151.71490.053
差值 ≥ 0.4250315-12.3030.000
两个 P 值中更大的值为 0.053。不能认为是等价。