单样本均值的随机化检验的随机化检验统计量和图形

请查找相关定义和解释指导,了解随单样本均值的随机化检验提供的每个随机化检验统计量和图形。

直方图

直方图将样本值分成多个区间并使用条形表示每个区间中的数据值频率。

解释

使用直方图可以检查自举分布的形状。 自举分布是每个重新采样样本的均值分布。 自举分布看上去应当为正态分布。 如果自举分布不是正态分布,您将无法信任结果。
50 个重新采样的样本
1000 个重新采样的样本

通常,重新采样的样本越多,越便于确定自举分布。例如,在这些数据中,对于 50 个重新采样样本,分布看上去不明确。对于 1000 个重新采样样本,分布形状看上去接近正态。

直方图直观地显示假设检验的结果。Minitab 调整数据,以便重新采样样本的中心与假设均值相同。 对于单侧检验,会在原始样本的均值出绘制参考线。对于双侧检验,会在原始样本的均值处以及假设均值相反一侧相同距离处绘制参考线。p 值是比参考线处的值更极端的样本均值的比率。换句话说,p 值是在假设原假设为真时,与原始样本一样极端的样本均值的比率。

在该直方图中,自举分布看上去为正态分布。 p 值为 0.2030 表示 20.3% 的样本均值小于原始样本的均值。

单值图

单值图显示样本中的单个值。每个圆形表示一个观测值。当您具有的观测值相对较少,以及需要评估每个观测值的效果时,单值图尤其有用。

注意

只有当您仅进行一次重新采样时,Minitab 才显示单值图。Minitab 既显示原始数据又显示重新采样数据。

解释

Minitab 调整数据,以便重新采样样本的中心与假设均值相同。首先, Minitab 计算假设均值与原始样本的均值之间的差值。然后,Minitab 将该差值与原始样本中的每个值进行相加或相减。重新采样的样本是从这个调整后的数据抽取的。

使用单值图可以对原始样本和随机化样本进行比较。随机化样本表示在总体均值等于假设值(原假设为真)时,随机样本的外观。这两个样本的中心之间的差值越大,否定原假设的证据越充分。
样本均值等于假设均值
样本均值 2 标准差小于假设均值

原假设和备择假设

原假设和备择假设是互斥的总体声明。假设检验使用样本数据来确定是否要否定原假设。
原假设
原假设声明如均值、标准差等总体参数等于假设值。原假设通常是基于先前分析或专业知识的初始声明。
备择假设
备择假设声明总体参数小于、大于或不同于原假设中的假设值。备择假设是可能相信为真实或有望证明为真实的内容。

解释

在输出中,原假设和备择假设可帮助您验证是否为假设均值输入了正确的值。

观测到的样本

变量N均值标准差方差最小值中位数最大值
时间1611.3313.1159.702181.3007.70010.05016.000

随机化检验

原假设H₀: μ = 12
备择假设H₁: μ < 12
重新采样数均值标准差P 值
100011.97830.76250.199

在这些结果中,原假设为总体均值等于 12。备择假设为均值小于 12。

重新采样的样本数

重新采样的样本数是 Minitab 从原始数据集随机抽取含替换内容的样本的次数。通常,重新采样的次数越多越好。

Minitab 调整数据,以便重新抽样样本的中心与假设均值相同。 首先, Minitab 计算假设均值与原始样本的均值之间的差值。然后,Minitab 将该差值与原始样本中的每个值进行相加或相减。重新采样的样本是从这个调整后的数据抽取的。每个重新采样样本的样本数量等于原始数据集的样本数量。 每个重新采样样本的数量等于直方图上的观测值数。

均值

均值是自举样本中所有均值之和除以重新采样的样本数。Minitab 调整数据,以便重新采样样本的中心与假设均值相同。

解释

Minitab 显示两个不同的均值:观测样本的均值和自举分布的均值。观测样本的均值是总体均值的估计值。自举分布的均值通常接近假设均值。这两个值之间的差值越大,否定原假设的证据越充分。

标准差(自举样本)

标准差是离差的最常用度量,即数据从均值展开的程度。符号 σ(西格玛)通常用于表示总体的标准差,而 s 用于表示样本的标准差。对某一过程而言随机或合乎自然规律的变异通常称为噪声。对某一过程而言随机或合乎自然规律的变异通常称为噪声。由于标准差与数据采用相同的单位,因此它通常比方差更易于解释。

自举样本的标准差(又称为自举标准误)是均值抽样分布的标准差估计值。 由于自举标准误是样本均值的变异性,而观测样本的标准差是各个观测值的变异性,因此自举标准误较小。

解释

使用标准差可以确定自举样本的均值从总体均值扩散的程度。 标准差值越大,均值越分散。 对于正态分布来说,好的经验法则是大约 68% 的值位于均值的一个标准差范围内,95% 的值位于两个标准差范围内,99.7% 的值位于三个标准差范围内。

使用自举样本的标准差可以估计自举均值的精确度。 值越小,精准度越高。通常,原始样本的标准差越大,自举标准误越大,假设检验的功效越不精确。 而且,通常,样本数量越小,自举标准误越大,假设检验的功效越小。

使用标准差还可以建立用来估计过程的总体变异性的基准。
医院 1
医院 2
医院出院时间

管理员对两家医院急诊部所治疗的患者的出院时间进行跟踪。 尽管平均出院时间大致相同(35 分钟),但标准差显著不同。 医院 1 的标准差大约为 6。 平均而言,患者的出院时间大约偏离均值(虚线)6 分钟。 医院 2 的标准差大约为 20。 平均而言,患者的出院时间大约偏离均值(虚线)20 分钟。

P 值

p 值是在假设原假设为真时,与原始样本一样极端的样本均值的比率。p 值越小,否定原假设的证据越充分。

解释

使用 p 值可确定总体均值在统计意义上是否不同于假设均值。

要确定总体均值和假设均值的差值在统计意义上是否显著,请将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在差异时得出存在差异的风险为 5%。
P 值 ≤ α:均值的差值在统计意义上显著(否定 H0
如果 p 值小于或等于显著性水平,则决策为否定原假设。您可以得出总体均值与假设均值的差值在统计意义上显著的结论。要计算置信区间并确定差值实际上是否显著,请使用单样本函数引导。有关更多信息,请转到统计显著性和实际显著性
P 值 > α:均值的差值在统计意义上不显著(无法否定 H0
如果 p 值大于显著性水平 0.05,则决策为无法否定原假设。您的证据不足,无法得出总体均值与假设均值之间的差值在统计意义上显著的结论。