解释 Poisson 分布的拟合优度检验 的所有统计量和图形

请查找定义和解释指导,了解随 Poisson 拟合优度检验提供的每个统计量和图形。

均值

Poisson 均值等于每个类别的总数乘以该类别中的观测值个数,再除以观测值总数。

N

样本中非缺失值的个数。

在该示例中,记录了 141 个观测值。
总数 N N*
149 141 8

N*

样本中缺失值的个数。缺失值个数是指包含缺失值符号 * 的单元格数。

在该示例中,数据收集期间出现 8 个错误,这些错误记录为缺失值。
总计数 N N*
149 141 8

Poisson 概率

每个类别的概率,假定数据服从 Poisson 分布且其均值等于从数据计算得出的 Poisson 均值。Minitab 使用 Poisson 概率计算预期值。

观测值和预期值

观测值是样本中属于某个类别的实际观测值个数。

预期值是当 Poisson 概率为真时预期的观测值个数。Minitab 通过将每个类别的 Poisson 概率与总样本数量相乘来计算预期计数。

如果任何类别的预期计数(又称预期频率)小于 5,则检验的结果可能无效。如果某个类别的预期计数太小,您可以将该类别与相邻类别合并以获得最小预期计数。

例如,财务部门有五个类别,用于分类发票过期的天数:15 或以下、16–30、31–45、46–60 以及 60 或以上。60 天或以上的类别的预期计数较小,因此财务部门将此类别与 46 到 60 天的类别合并,共同组成一个名为 45 天或以上的类别。

解释

可以通过使用输出表或条形图来比较观测值和预期值。如果观测值与预期值之间的差值较大,则表明数据不服从 Poisson 分布。

在这些结果中,对于大多数类别,预期计数看上去与观测计数不是很接近。

方法

观测值 中的频率

描述性统计量

N均值
3000.536667

缺陷数 的观测和期望计数

缺陷数Poisson 概率观测计数期望计数对卡方的贡献
00.584694213175.4088.056
10.3137864194.13629.993
20.0841991825.2602.086
>=30.017321285.196100.072

卡方检验

原假设H₀: 数据遵循 Poisson 分布
备择假设H₁: 数据不遵循 Poisson 分布
自由度卡方P 值
2140.2080.000

对卡方的贡献

使用各个类别的贡献可以量化合计卡方统计量对每个类别的离散度的贡献。

Minitab 是用类别的观测值与预期值的差值平方除以该类别的预期值来计算每个类别对卡方统计量的贡献的。卡方统计量是所有类别的贡献值之和。

解释

观测值和预期值之间具有较大差值的类别对于整体卡方统计量的贡献较大。

方法

观测值 中的频率

描述性统计量

N均值
3000.536667

缺陷数 的观测和期望计数

缺陷数Poisson 概率观测计数期望计数对卡方的贡献
00.584694213175.4088.056
10.3137864194.13629.993
20.0841991825.2602.086
>=30.017321285.196100.072

卡方检验

原假设H₀: 数据遵循 Poisson 分布
备择假设H₁: 数据不遵循 Poisson 分布
自由度卡方P 值
2140.2080.000

在这些结果中,每个类别的卡方值会汇总为整体卡方统计量,即 140.208。最大的贡献来自包含 3 个或更多缺陷的类别。此结果表明,观测计数和预期计数之间的最大差值位于包含 3 个或更多缺陷的类别中。观测计数和预期计数之间的最小差值位于包含 2 个缺陷的类别中。

原假设和备择假设

原假设和备择假设是互斥的总体声明。假设检验使用样本数据来确定是否要否定原假设。
原假设
原假设声明总体服从特定分布。原假设通常是基于先前分析或专业知识的初始声明。
备择假设
备择假设声明总体不服从特定分布。

自由度

自由度 (DF) 是有关统计量的独立信息段数。Poisson 拟合优度检验的自由度是类别数减去 2。

解释

Minitab 使用自由度来确定检验统计量。研究中的类别越多,自由度越大。

卡方

卡方统计量是对样本数据的分布与预期的 Poisson 分布之间差异程度进行测量的检验统计量。

解释

可以使用卡方统计量来确定是否要否定原假设。但是,P 值更常用,因为它更容易解释。P 值是当数据服从 Poisson 分布时,获得至少与从样本计算得出的值一样极端的检验统计量(如卡方统计量)的检测概率。

为了确定是否要否定原假设,请将卡方统计量与临界值进行比较。如果卡方统计量大于临界值,则否定原假设。否则,无法否定原假设。您可以在 Minitab 中计算临界值,也可以在大多数统计书籍的卡方分布表中查找临界值。有关更多信息,请转到使用逆累积分布函数 (ICDF),然后单击“使用 ICDF 计算临界值”。

Minitab 使用卡方统计量计算 p 值。

P 值

P 值是一个概率,用来度量否定原假设的证据。P 值越小,否定原假设的证据越充分。

解释

使用 p 值可确定数据是否不服从 Poisson 分布。

要确定数据是否不服从 Poisson 分布,请将 p 值与显著性水平 (α) 进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 表示当数据实际上服从 Poisson 分布时,断定数据不服从 Poisson 分布的风险为 5%。
P 值 ≤ α:数据不服从 Poisson 分布(否定 H0
如果 p 值小于或等于显著性水平,则决策为否定原假设并得出数据不服从 Poisson 分布的结论。
P 值 > α:无法得出数据不服从 Poisson 分布的结论(无法否定 H0
如果 p 值大于显著性水平,则决策为无法否定原假设,因为没有足够的证据得出数据不服从 Poisson 分布的结论。

按类别分组的卡方值贡献图

此条形图绘制每个类别对整体卡方统计量的贡献。您可以选择按贡献对类别进行降序排序的图表。

解释

观测值和预期值之间具有较大差值的类别对于整体卡方统计量的贡献较大。

此条形图指示预期值和观测值之间的最大差值位于包含 3 个或更多缺陷的类别中。

观测值和预期值图表

可使用观测值与预期值的条形图确定对于每个类别而言观测值数目是否不同于预期值数目。如果观测值与预期值之间的差值较大,则表明数据不服从 Poisson 分布。

该条形图显示 0 个缺陷、1 个缺陷和 3 个以上缺陷所对应的观测值不同于预期值。因此,该条形图以可视形式确认 p 值所表示的内容,即,数据不服从 Poisson 分布。