解释 双样本 t 的主要结果

请完成以下步骤来解释双样本 t 检验。主要输出包括差值估计值、置信区间、p 值和多个图形。

步骤 1:确定总体均值差值的置信区间

首先考虑样本均值的差值,然后检查置信区间。

差值是对总体均值中差值的估计值。由于差值基于样本数据而不是整个总体,因此样本差值通常不等于总体差值。使用差值的置信区间可以更好地估计总体差值。

置信区间提供两个总体均值之间差值的可能值范围。例如,95% 置信水平表明,如果从总体中随机抽取 100 个样本,则大约 95 个样本将产生包含总体差值的区间。置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。有关更多信息,请转到获得更加精确的置信区间的方法

差值的估计值

差值差值的 95% 置信区间
21.00(14.22, 27.78)
主要结果:差值估计值、差值的 95% 置信区间

在这些结果中,医院评分的总体均值之差的估计值为 21。总体均值之差介于 14.22 和 27.78 之间的可信度为 95%。

步骤 2:确定方差在统计意义上是否显著

要确定总体均值的差值在统计意义上是否显著,请将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在差值时得出存在差值的风险为 5%。
P 值 ≤ α:均值的差值在统计意义上显著(否定 H0
如果 p 值小于或等于显著性水平,则决策为否定原假设。您可以得出总体均值的差值不等于假设差值的结论。如果您没有指定假设差值,Minitab 将检验均值之间是否不存在差值(假设差值 = 0)。请使用您的专业知识确定差值在实际意义上是否显著。有关更多信息,请转到统计显著性和实际显著性
P 值 > α:均值的差值在统计意义上不显著(无法否定 H0
如果 p 值大于显著性水平,则决策为无法否定原假设。您没有足够的证据得出总体均值的差值在统计意义上显著的结论。您应该确保检验具有足够的功效来检测到在实际意义上显著的差值。有关更多信息,请转到双样本 t 的功效和样本数量

检验

原假设H₀: μ₁ - µ₂ = 0
备择假设H₁: μ₁ - µ₂ ≠ 0
T 值自由度P 值
6.31320.000
主要结果:P 值

在这些结果中,原假设声明两家医院的平均评级之间的差值为 0。由于 p 值为 0.00,小于显著性水平 0.05,因此决策为否定原假设并得出两家医院的评级不同的结论。

步骤 3:检查数据是否有问题

您数据中存在的问题(如偏度和异常值)可对结果产生不利影响。可使用图形来查找偏度(通过检查每个样本的散布)以及确定可能的异常值。

检查数据的散布以确定数据看上去是否偏斜。

当数据偏斜时,大多数数据位于图形的高或低侧。通常情况下,在直方图或箱线图中最易于检测偏度。

右偏斜
左偏斜

带右偏斜数据的箱线图显示等待时间。大部分等待时间相对较短,只有少数等待时间很长。带左偏斜数据的箱线图显示失效时间数据。少数几个项立即失败,更多的项会在随后失败。

如果您的样本小(小于 15 个值),严重偏斜的数据可影响 p 值的有效性。如果您的数据严重偏斜,并且样本较小,请考虑增大样本数量。

示例输出

在这些箱线图中,医院 B 的数据似乎严重偏斜。

识别异常值

异常值是远离其他数据值的数据值,可以显著影响您的分析结果。通常情况下,在箱线图上最容易识别异常值。

在箱线图上,星号 (*) 表示异常值。

尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。有关更多信息,请转到标识异常值

示例输出

在这些箱线图中,医院 B 的数据有 2 个异常值。