解释相关性的卡方检验的所有统计量

请查找定义和解释指导,了解随相关性卡方检验提供的每个统计量。

实测计数和预期计数

实测计数是样本中属于某个类别的实际观测值个数。

预期计数是预期的平均单元格频率(如果变量之间相互独立)。Minitab 通过将总行数和总列数的乘积除以观测值总数来计算预期计数。

解释

您可以比较输出表格中每个单元格的实测值和预期值。在这些结果中,实测单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字。

如果两个变量相关,则一个变量的观测值的分布是否会因另一个变量的类别而异。如果两个变量不相关,则一个变量的观测值的分布将类似于另一个变量的所有类别的分布。在此例中,表格的第 1 列、第 2 行显示,观测计数为 76,预期计数为 60.78。如果变量之间不相关,则实测计数似乎比预期计数大得多。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
  -1.07880.00501.2726 
         
2764732155
  60.7850.9143.31 
  1.9516-0.5476-1.7184 
         
3364034110
  43.1436.1330.74 
  -1.08670.64430.5889 
         
全部160134114408
单元格内容
      计数
      期望计数
      标准化残差

所有行和列计数

Minitab 会显示行和列的边际计数。
行计数
每个表格行中的计数和。
列计数
每个表格列中的计数和。
合计
所有单元格的计数和。所有行计数的和等于所有列计数的和。

解释

可以使用边际计数了解计数在类别之间是如何分布的。

在这些结果中,行 1 的总数为 143,行 2 的总数为 155,行 3 的总数为 110。所有行的总和为 408。列 1 的总数为 160,列 2 的总数为 134,列 3 的总数为 114。所有列的总和为 408。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
  -1.07880.00501.2726 
         
2764732155
  60.7850.9143.31 
  1.9516-0.5476-1.7184 
         
3364034110
  43.1436.1330.74 
  -1.08670.64430.5889 
         
全部160134114408
单元格内容
      计数
      期望计数
      标准化残差

卡方的贡献

Minitab 会显示每个单元格的卡方统计量贡献,从而量化每个单元格差异队总卡方统计量的贡献。

Minitab 通过将单元格的观测值与预期值的差值平方除以该单元格的预期值,来计算每个单元格的卡方统计量的贡献。卡方统计量是所有单元格的这些值的总和。

解释

在这些结果中,每个单元格的卡方总和就是 Pearson 卡方统计量,该值为 11.788。最大贡献来自第 1 个班次和第 3 个班次使用的机器 2。最小贡献来自使用机器 1 和 2 的第 2 个班次。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
  1.16370.00001.6195 
         
2764732155
  60.7850.9143.31 
  3.80880.29982.9530 
         
3364034110
  43.1436.1330.74 
  1.18090.41510.3468 
         
全部160134114408
单元格内容
      计数
      期望计数
      对卡方的贡献

卡方检验

卡方自由度P 值
Pearson11.78840.019
似然比11.81640.019

Pearson 卡方和似然比卡方

Minitab 执行 Pearson 卡方检验和似然比卡方检验。每个卡方检验都可用于确定变量之间是否关联(相关)。
Pearson 卡方检验

Pearson 卡方统计量 (χ2) 涉及实测频率与预期频率的平方差。

似然比卡方检验

似然比卡方统计量 (G2) 基于实测频率与预期频率的比值。

解释

使用卡方统计量检验变量之间是否关联。

在这些结果中,两个卡方统计量都非常相似。可使用 p 值来评估卡方统计量的显著性。

卡方检验

卡方自由度P 值
Pearson11.78840.019
似然比11.81640.019

当预期计数较少时,您的结果可能有误导性。有关更多信息,请参见相关性的卡方检验的数据注意事项

自由度

自由度 (DF) 是有关统计量的独立信息的条数。表格的自由度为(行数 – 1)乘以(列数 – 1)。

解释

Minitab 使用自由度来确定与检验统计量相关的 p 值。

在这些结果中,自由度 (DF) 为 4。

卡方检验

卡方自由度P 值
Pearson11.78840.019
似然比11.81640.019

P 值

p 值是一个概率,用来度量否定原假设的证据。概率越低,否定原假设的证据越充分。

使用 p 值来确定可以否定还是无法否定原假设,以表明两个类别变量之间不存在关联。

Minitab 使用卡方统计量确定 p 值。

注意

当任何预期计数小于 1 时,Minitab 不会显示 p 值,因为这些结果可能无效。

解释

要确定变量之间是否相互独立,可将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 表明变量之间在实际上不存在关联时断定存在关联的风险为 5%。
P 值 ≤ α:变量之间的关联在统计上显著(否定 H0
如果 p 值小于或等于显著性水平,则可以否定原假设并断定变量之间的关联在统计上显著。
P 值 > α:无法断定变量之间存在关联(无法否定 H0
如果 p 值大于显著性水平,则无法否定原假设,因为没有足够的证据可以断定变量之间存在关联。

在这些结果中,p 值 = 0.019。由于 p 值小于 α,因此您可以否定原假设。您可以断定变量之间是关联的。

卡方检验

卡方自由度P 值
Pearson11.78840.019
似然比11.81640.019

原始残差

原始残差是实测计数和预期计数之间的差值。
实测计数
实测计数是样本中属于某个类别的实际观测值个数。
期望计数

期望计数是变量独立的情况下预计单元格中的平均频率。Minitab 会计算预期计数(行和列合计乘积除以观测值总数)。

解释

您可以比较输出表格中的实测值和预期值。

在这些结果中,单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字,原始残差是每个单元格中的第三个数字。机器 2、第 1 个班次的原始残差最大,这表示在第 1 个班次使用的机器 2 上发现的预期缺陷和实际缺陷之间的差值最大。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
  -8.0780.0348.044 
         
2764732155
  60.7850.9143.31 
  15.216-3.907-11.309 
         
3364034110
  43.1436.1330.74 
  -7.1373.8733.265 
         
全部160134114408
单元格内容
      计数
      期望计数
      残差
标准化残差更适用于比较实测计数和预期计数。

标准化残差

标准化残差等于原始残差(或实测计数与预期计数的差值)除以预期计数的平方根。

解释

您可以比较输出表格中的标准化残差,以确定哪些变量类别在相对于样本数量的预期计数和实际计数之间存在的差异最大,并且似乎相关。例如,您可以评估输出表格中的标准化残差,以确定产生缺陷的机器和班次之间的关联。

在这些结果中,单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字,标准化残差是每个单元格中的第三个数字。正标准化残差表示不合格把手的数量比预期多。负标准化残差表示不合格把手的数量比预期少。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
  -1.07880.00501.2726 
         
2764732155
  60.7850.9143.31 
  1.9516-0.5476-1.7184 
         
3364034110
  43.1436.1330.74 
  -1.08670.64430.5889 
         
全部160134114408
单元格内容
      计数
      期望计数
      标准化残差

调整残差

调整残差就是原始残差(即实测计数和预期计数之间的差值)除以标准误的估计值。调整残差可用于解释因样本数量产生的变异。

解释

您可以比较输出表格中的调整残差以确定哪些类别在相对于样本数量的预期计数和实际计数之间的差异最大。例如,您可以确定哪个机器或班次的预期缺陷品数量和实际缺陷品数量之间的差异最大。

在这些结果中,单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字,调整残差是每个单元格中的第三个数字。调整残差为正数时,表示有缺陷的把手比预期多(已根据样本数量调整)。调整残差为负数时,表示有缺陷的把手比预期少(已根据样本数量调整)。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
  -1.71690.00761.8602 
         
2764732155
  60.7850.9143.31 
  3.1788-0.8485-2.5707 
         
3364034110
  43.1436.1330.74 
  -1.63090.91990.8117 
         
全部160134114408
单元格内容
      计数
      期望计数
      调整残差