解释 单样本 Z 的所有统计量和图形

请查找定义和解释指导,了解随单样本 Z 分析提供的每个统计量和图形。

原假设和备择假设

原假设和备择假设是互斥的总体声明。假设检验使用样本数据来确定是否要否定原假设。
原假设
原假设声明总体参数(如均值、标准差等)等于假设值。原假设通常是基于先前分析或专业知识的初始声明。
备择假设
备择假设声明总体参数小于、大于或不同于原假设中的假设值。备择假设是可能相信为真实或有望证明为真实的内容。

在输出中,原假设和备择假设可帮助您验证是否为假设均值输入了正确的值。

标准差

标准差是离差的最常用度量,即数据从均值展开的程度。符号 σ(西格玛)通常用于表示总体的标准差,而 s 用于表示样本的标准差。对某一过程而言随机或合乎自然规律的变异通常称为噪声。对某一过程而言随机或合乎自然规律的变异通常称为噪声。

标准差与数据采用相同的单位。

解释

使用标准差可以确定数据从均值扩散的程度。 标准差值越大,数据越分散。 对于正态分布来说,好的经验法则是大约 68% 的值位于均值的一个标准差范围内,95% 的值位于两个标准差范围内,99.7% 的值位于三个标准差范围内。

Minitab 显示两个不同的标准差值。已知标准差是您在运行分析之前输入的总体标准差。该标准差用于计算置信区间和 Z 值。标准差 (StDev) 是样本数据的标准差。因为您知道总体的标准差,所以 Minitab 不会使用来自样本的值进行任何计算。

如果您不知道总体的标准差,请使用单样本 t

N

样本数量 (N) 是样本中的观测值总数。

解释

样本数量会影响置信区间和检验功效。

通常,数量较大的样本将产生较窄的置信区间。样本数量越大,检验检测到差值的功效越大。有关更多信息,请转到什么是功效?

均值

均值使用表示数据中心的单个值来汇总样本值。均值是数据的平均值,即所有观测值之和除以观测值的个数。

解释

样本数据的均值是对总体均值的估计值。

由于均值基于样本数据而不是整个总体,因此样本均值通常不等于总体均值。使用置信区间可以更好地估计总体均值。

均值的标准误

均值的标准误(SE 均值)估计样本均值之间的变异性,样本均值是在对相同总体重复抽样的情况下获得的。而均值的标准误估计样本之间的变异性,标准差度量单个样本内的变异性。

例如,根据 312 个交货时间的随机样本,得到平均交货时间为 3.80 天,标准差为 1.43 天。这些数字产生的均值标准误为 0.08 天(1.43 除以 312 的平方根)。如果从相同总体中抽取大小相同的多个随机样本,则这些不同样本均值的标准差将大约为 0.08 天。

解释

使用均值的标准误可以确定样本均值对总体均值的估计精确度。

均值的标准误越小,对总体均值的估计越精确。通常,标准差越大,均值的标准误就越大,对总体均值的估计也越不精确。样本越大,均值的标准误就越小,对总体均值的估计也越精确。

Minitab 使用均值的标准误来计算置信区间。

置信区间 (CI) 和界限

置信区间提供总体均值的可能值范围。由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间或限值会包含未知的总体均值。这些包含均值的置信区间或限值的百分比是区间的置信水平。例如,95% 置信水平表明,如果从总体中随机抽取 100 个样本,则大约 95 个样本将产生包含总体均值的区间。

上限定义可能大于总体均值的值。下限定义可能小于总体均值的值。

置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。有关更多信息,请转到获得更加精确的置信区间的方法

描述性统计量

N均值标准差均值标准误μ 的 95% 置信区间
2016.4602.2580.581(15.321, 17.599)
μ: 脂肪百分比 的总体均值
已知标准差 = 2.6

在这些结果中,脂肪百分比的总体均值估计值为16.46%。总体均值介于 15.321% 和 17.599% 之间的可信度为 95%。

Z 值

Z 值是 Z 检验的检验统计量,它度量观测到的统计量与假设总体参数之间的差值,以标准误为单位。

解释

可以通过将 Z 值与标准正态分布的临界值进行比较来确定是否要否定原假设。但是,使用检验的 p 值做出相同的决定通常更实际且更方便。

为了确定是否要否定原假设,请将 Z 值与临界值进行比较。对于双侧检验,临界值是 Z1-α/2;而对于单侧检验,临界值是 Z1-α。对于双侧检验,如果 Z 值的绝对值大于临界值,则可以否定原假设。如果 Z 值的绝对值小于临界值,则无法否定原假设。您可以在 Minitab 中计算临界值,也可以从大多数统计书籍的标准正态分布表中查找临界值。有关更多信息,请转到使用逆累积分布函数 (ICDF),然后单击“使用 ICDF 计算临界值”。

Z 值可用于计算 p 值。

P 值

P 值是一个概率,用来度量否定原假设的证据。P 值越小,否定原假设的证据越充分。

解释

使用 p 值可确定总体均值在统计意义上是否不同于假设均值。

要确定总体均值和假设均值的差值在统计意义上是否显著,请将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在差值时得出存在差值的风险为 5%。
P 值 ≤ α:均值的差值在统计意义上显著(否定 H0
如果 p 值小于或等于显著性水平,则决策为否定原假设。您可以得出总体均值和假设均值的差值在统计意义上显著的结论。请使用您的专业知识确定差值在实际意义上是否显著。有关更多信息,请转到统计显著性和实际显著性
P 值 > α:均值的差值在统计意义上不显著(无法否定 H0
如果 p 值大于显著性水平,则决策为无法否定原假设。您没有足够的证据得出总体均值与假设均值的差值在统计意义上显著的结论。您应该确保检验具有足够的功效来检测到在实际意义上显著的差值。有关更多信息,请转到单样本 Z 的功效和样本数量

直方图

直方图将样本值分成许多区间,并使用条形表示每个区间中的数据值的频率。

解释

可使用直方图评估数据的形状和散布。 当样本数量大于 20 时,直方图具有最佳状态。

偏斜数据

检查数据的散布以确定数据看上去是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。通常情况下,在直方图或箱线图中最易于检测偏度。

右偏斜
左偏斜

带右偏斜数据的直方图显示等待时间。大部分等待时间相对较短,只有少数等待时间很长。带左偏斜数据的条形图显示故障时间数据。有几个项目立即失败,还有其他许多项目在随后失败。

如果您的样本小(小于 20 个值),严重偏斜的数据可影响 p 值的有效性。如果您的数据严重偏斜,并且样本小,请考虑增大样本数量。

异常值

异常值,是远离其他数据值的数据值,可以显著影响您的分析结果。通常情况下,在箱线图上最容易识别异常值。

在直方图上,图形任一端上的孤立条形标识可能的异常值。

尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。有关更多信息,请转到 标识异常值

单值图

单值图显示样本中的单个值。每个圆形表示一个观测值。当您具有的观测值相对较少,以及需要评估每个观测值的效果时,单值图尤其有用。

解释

可使用单值图检查数据的散布,以及确定任何可能的异常值。 当样本数量小于 50 时,单值图具有最佳状态。

偏斜数据

检查数据的散布以确定数据看上去是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。通常情况下,在直方图或箱线图中最易于检测偏度。

右偏斜
左偏斜

带右偏斜数据的单值图显示等待时间。大部分等待时间相对较短,只有少数等待时间很长。带左偏斜数据的单值图显示故障时间数据。有几个项目立即失败,还有其他许多项目在随后失败。

如果您的样本小(小于 20 个值),严重偏斜的数据可影响 p 值的有效性。如果您的数据严重偏斜,并且样本小,请考虑增大样本数量。

异常值

异常值,是远离其他数据值的数据值,可以显著影响您的分析结果。通常情况下,在箱线图上最容易识别异常值。

在单值图上,异常低或高的数据值表示可能的异常值。

尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。有关更多信息,请转到 标识异常值

箱线图

箱线图提供了样本分布的图形汇总。箱线图显示数据的形状、集中趋势和变异性。

解释

可使用箱线图检查数据的散布,以及确定任何可能的异常值。 当样本数量大于 20 时,箱线图具有最佳状态。

偏斜数据

检查数据的散布以确定数据看上去是否偏斜。当数据偏斜时,大多数数据位于图形的高或低侧。通常情况下,在直方图或箱线图中最易于检测偏度。

右偏斜
左偏斜

带右偏斜数据的箱线图显示等待时间。大部分等待时间相对较短,只有少数等待时间很长。带左偏斜数据的箱线图显示故障时间数据。有几个项目立即失败,还有其他许多项目在随后失败。

如果您的样本小(小于 20 个值),严重偏斜的数据可影响 p 值的有效性。如果您的数据严重偏斜,并且样本小,请考虑增大样本数量。

异常值

异常值,是远离其他数据值的数据值,可以显著影响您的分析结果。通常情况下,在箱线图上最容易识别异常值。

在箱线图上,星号 (*) 表示异常值。

尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。有关更多信息,请转到 标识异常值