解释 双样本 Poisson 率 的所有统计量

请查找定义和解释指导,了解随双样本 Poisson 率分析提供的每个统计量。

差值 = 率1 - 率2

差值是您要估计的总体率之间的未知差值。Minitab 指出从哪个总体率中减去另一个总体率。

观测值长度

Poisson 过程对某事件或属性在特定观测值范围内的发生次数进行计数,观测值范围可以表示时间、面积、体积和项目数等内容。观测值的长度表示每个观测值范围的幅度、持续时间或大小。

解释

Minitab 使用观测值长度将样本率转换为最适合您的情形的形式。

例如,如果每个样本观测值对一年中的事件数进行计数,则长度 1 表示每年发生率,长度 12 表示每月发生率。

Minitab 使用总发生次数、样本数量 (N) 和观测值长度来计算样本率。例如,检查员检查 2 条装配线(A 和 B)上每箱毛巾的缺陷数量。一条毛巾可能会有多个缺陷,如 1 处破洞和 2 处拉伸(3 个缺陷)。对于装配线 A,,每箱包含 10 条毛巾。检查员总共抽取 50 箱,共发现 122 个缺陷。对于装配线 B,每箱包含 15 条毛巾。检查员总共抽取 50 箱,共发现 132 个缺陷。
  • 对于装配线 A,总发生次数为 112,因为检查员发现了 112 个缺陷。装配线 B 的总发生次数为 132,因为检查员发现了 132 个缺陷。
  • 对于这两条装配线,样本数量 (N) 均为 50,因为检查员对于这两条装配线均抽取了 50 箱。
  • 为了确定每条毛巾的缺陷数,检查员对装配线 A 使用观测值长度 10,因为每箱有 10 条毛巾。对于装配线 B,检查员使用观测值长度 15。
  • 对于装配线 A,样本率为(总发生次数/N)/(观测值长度)= (112/50)/10 = 0.224。对于装配线 B,样本率为 (132/50)/15 = 0.176。因此,装配线 A 中每条毛巾平均有 0.244 个缺陷,装配线 B 中每条毛巾平均有 0.176 个缺陷。
  • 因为检查员输入了不等于 1 的观测值长度,所以 Minitab 也会计算样本均值。对于装配线 A,样本均值为(总发生次数 / N)= (112/50) = 2.24。对于装配线 B,样本均值为 132/50 = 2.64。样本均值描述每的平均缺陷数。但是,因为每箱的毛巾数量不同,所以样本率是更有用的统计量。

总出现次数

总发生次数是事件在样本中的发生次数。

Minitab 使用总发生次数、样本数量 (N) 和观测值长度来计算样本率。例如,检查员检查 2 条装配线(A 和 B)上每箱毛巾的缺陷数量。一条毛巾可能会有多个缺陷,如 1 处破洞和 2 处拉伸(3 个缺陷)。对于装配线 A,,每箱包含 10 条毛巾。检查员总共抽取 50 箱,共发现 122 个缺陷。对于装配线 B,每箱包含 15 条毛巾。检查员总共抽取 50 箱,共发现 132 个缺陷。
  • 对于装配线 A,总发生次数为 112,因为检查员发现了 112 个缺陷。装配线 B 的总发生次数为 132,因为检查员发现了 132 个缺陷。
  • 对于这两条装配线,样本数量 (N) 均为 50,因为检查员对于这两条装配线均抽取了 50 箱。
  • 为了确定每条毛巾的缺陷数,检查员对装配线 A 使用观测值长度 10,因为每箱有 10 条毛巾。对于装配线 B,检查员使用观测值长度 15。
  • 对于装配线 A,样本率为(总发生次数/N)/(观测值长度)= (112/50)/10 = 0.224。对于装配线 B,样本率为 (132/50)/15 = 0.176。因此,装配线 A 中每条毛巾平均有 0.244 个缺陷,装配线 B 中每条毛巾平均有 0.176 个缺陷。
  • 因为检查员输入了不等于 1 的观测值长度,所以 Minitab 也会计算样本均值。对于装配线 A,样本均值为(总发生次数 / N)= (112/50) = 2.24。对于装配线 B,样本均值为 132/50 = 2.64。样本均值描述每的平均缺陷数。但是,因为每箱的毛巾数量不同,所以样本率是更有用的统计量。

N

样本数量 (N) 是样本中的观测值总数。

解释

样本数量影响置信区间、测试功效以及发生率。

通常,数量较大的样本将产生较窄的置信区间。样本数量越大,检验检测到差值的功效越大。有关更多信息,请转到什么是功效?

Minitab 使用总发生次数、样本数量 (N) 和观测值长度来计算样本率。例如,检查员检查 2 条装配线(A 和 B)上每箱毛巾的缺陷数量。一条毛巾可能会有多个缺陷,如 1 处破洞和 2 处拉伸(3 个缺陷)。对于装配线 A,,每箱包含 10 条毛巾。检查员总共抽取 50 箱,共发现 122 个缺陷。对于装配线 B,每箱包含 15 条毛巾。检查员总共抽取 50 箱,共发现 132 个缺陷。
  • 对于装配线 A,总发生次数为 112,因为检查员发现了 112 个缺陷。装配线 B 的总发生次数为 132,因为检查员发现了 132 个缺陷。
  • 对于这两条装配线,样本数量 (N) 均为 50,因为检查员对于这两条装配线均抽取了 50 箱。
  • 为了确定每条毛巾的缺陷数,检查员对装配线 A 使用观测值长度 10,因为每箱有 10 条毛巾。对于装配线 B,检查员使用观测值长度 15。
  • 对于装配线 A,样本率为(总发生次数/N)/(观测值长度)= (112/50)/10 = 0.224。对于装配线 B,样本率为 (132/50)/15 = 0.176。因此,装配线 A 中每条毛巾平均有 0.244 个缺陷,装配线 B 中每条毛巾平均有 0.176 个缺陷。
  • 因为检查员输入了不等于 1 的观测值长度,所以 Minitab 也会计算样本均值。对于装配线 A,样本均值为(总发生次数 / N)= (112/50) = 2.24。对于装配线 B,样本均值为 132/50 = 2.64。样本均值描述每的平均缺陷数。但是,因为每箱的毛巾数量不同,所以样本率是更有用的统计量。

样本率

事件的样本率是事件在样本中观测值的每个单位长度内发生的平均次数。

解释

每个样本的样本率是对每个样本的总体率的估计值。

Minitab 使用总发生次数、样本数量 (N) 和观测值长度来计算样本率。例如,检查员检查 2 条装配线(A 和 B)上每箱毛巾的缺陷数量。一条毛巾可能会有多个缺陷,如 1 处破洞和 2 处拉伸(3 个缺陷)。对于装配线 A,,每箱包含 10 条毛巾。检查员总共抽取 50 箱,共发现 122 个缺陷。对于装配线 B,每箱包含 15 条毛巾。检查员总共抽取 50 箱,共发现 132 个缺陷。
  • 对于装配线 A,总发生次数为 112,因为检查员发现了 112 个缺陷。装配线 B 的总发生次数为 132,因为检查员发现了 132 个缺陷。
  • 对于这两条装配线,样本数量 (N) 均为 50,因为检查员对于这两条装配线均抽取了 50 箱。
  • 为了确定每条毛巾的缺陷数,检查员对装配线 A 使用观测值长度 10,因为每箱有 10 条毛巾。对于装配线 B,检查员使用观测值长度 15。
  • 对于装配线 A,样本率为(总发生次数/N)/(观测值长度)= (112/50)/10 = 0.224。对于装配线 B,样本率为 (132/50)/15 = 0.176。因此,装配线 A 中每条毛巾平均有 0.244 个缺陷,装配线 B 中每条毛巾平均有 0.176 个缺陷。
  • 因为检查员输入了不等于 1 的观测值长度,所以 Minitab 也会计算样本均值。对于装配线 A,样本均值为(总发生次数 / N)= (112/50) = 2.24。对于装配线 B,样本均值为 132/50 = 2.64。样本均值描述每的平均缺陷数。但是,因为每箱的毛巾数量不同,所以样本率是更有用的统计量。

样本均值

当观测长度不等于 1 时,Minitab 会显示样本均值。样本均值等于总发生次数除以样本数量。但是,由于观测值长度不等于 1,因此对于您的特定情形,样本率通常更有用。

估计的差值

The estimated difference is the difference between the rates of occurrence of the two samples.

由于差值基于样本数据而不是整个总体,因此样本差值通常不等于总体差值。使用差值的置信区间可以更好地估计总体差值。

置信区间 (CI) 和界限

置信区间提供总体差值的可能值范围。由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间或限值会包含未知的总体差值。这些包含差值的置信区间或限值的百分比是区间的置信水平。例如,95% 置信水平表明,如果从总体中随机抽取 100 个样本,则大约 95 个样本将产生包含总体差值的区间。

上限定义可能大于总体差值的值。下限定义可能小于总体差值的值。

置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。有关更多信息,请转到获得更加精确的置信区间的方法

差值的估计值

估计的差值差值的 95% 置信区间
-7.7(-14.6768, -0.723175)

在这些结果中,两个邮局顾客到访人次的总体发生率差值的估计值为 −7.7。总体率差值介于大约 −14.7 和 −0.7 之间的可信度为 95%。

原假设和备择假设

差值检验显示原假设和备择假设。原假设和备择假设是互斥的总体声明。假设检验使用样本数据来确定是否要否定原假设。
原假设
原假设声明总体参数(如均值、标准差等)等于假设值。原假设通常是基于先前分析或专业知识的初始声明。
备择假设
备择假设声明总体参数小于、大于或不同于原假设中的假设值。备择假设是可能相信为真实或有望证明为真实的内容。

在输出中,原假设和备择假设可帮助您验证是否为检验差值输入了正确的值。

Z 值

Z 值是 Z 检验的检验统计量,它度量观测到的统计量与假设总体参数之间的差值,以标准误为单位。

解释

可以通过将 Z 值与标准正态分布的临界值进行比较来确定是否要否定原假设。但是,使用检验的 p 值做出相同的决定通常更实际且更方便。

为了确定是否要否定原假设,请将 Z 值与临界值进行比较。对于双侧检验,临界值是 Z1-α/2;而对于单侧检验,临界值是 Z1-α。对于双侧检验,如果 Z 值的绝对值大于临界值,则可以否定原假设。如果 Z 值的绝对值小于临界值,则无法否定原假设。您可以在 Minitab 中计算临界值,也可以从大多数统计书籍的标准正态分布表中查找临界值。有关更多信息,请转到使用逆累积分布函数 (ICDF),然后单击“使用 ICDF 计算临界值”。

Z 值可用于计算 p 值。

P 值

P 值是一个概率,用来度量否定原假设的证据。P 值越小,否定原假设的证据越充分。

解释

使用 p 值可确定总体发生率的差值在统计意义上是否显著。

要确定发生率的差值在统计意义上是否显著,请将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在差值时得出存在差值的风险为 5%。
P 值 ≤ α:率的差值在统计意义上显著(否定 H0
如果 p 值小于或等于显著性水平,则决策为否定原假设。您可以得出总体率的差值不等于假设差值的结论。如果您没有指定假设差值,Minitab 将检验率之间是否不存在差值(假设差值 = 0)。请使用您的专业知识确定差值在实际意义上是否显著。有关更多信息,请转到统计显著性和实际显著性
P 值 > α:率的差值在统计意义上不显著(无法否定 H0
如果 p 值大于显著性水平,则决策为无法否定原假设。您没有足够的证据得出总体率存在差异的结论。您应该确保检验具有足够的功效来检测到在实际意义上显著的差值。有关更多信息,请转到双样本 Poisson 率的功效和样本数量

当假设的差值等于 0 时,Minitab 将使用精确过程检验原假设。精确检验的 p 值是此精确过程的结果。其他 p 值基于正态近似,并且在总发生次数较低时可能不准确。