独立样本是随机选择的样本,因此它的观测值不依赖其他观测值。许多统计分析都基于样本是独立样本这一假设。其他分析在设计上用于评估非独立样本。
例如,假设质量检查员想要通过比较两个实验室来确定它们的血液检验是否给出相似的结果。他们将从相同 10 名儿童中抽取的血液样本送到这两个实验室进行分析。
儿童 | 实验室 A | 实验室 B |
---|---|---|
1 | 0.8 | 0.7 |
2 | 4.8 | 5 |
3 | 7.9 | 7.8 |
4 | 15.7 | 16.3 |
5 | 21.2 | 20.2 |
6 | 9.7 | 9.4 |
7 | 38.7 | 44 |
8 | 5.1 | 5.1 |
9 | 29 | 26.9 |
10 | 75.2 | 74.6 |
由于这两个实验室检验来自相同 10 名儿童的血液样本,因此检验结果不是独立的。为了比较两个实验室的平均血液检验结果,检查员将需要执行配对 t 检验,该检验基于样本是相关样本这一假设。
为了获得独立样本,检查员将需要随机选择 10 名儿童并使用实验室 A 检验这些儿童,然后随机选择另一组不同的 10 名儿童并使用实验室 B 检验这些儿童。之后,检查员使用双样本 t 检验比较来自这两个实验室的平均血液检验结果,双样本 t 检验基于样本是独立样本这一假设。