交叉分组表和卡方的列表统计量

请查找定义和解释指导,了解随类别变量的交叉分组表提供的每个统计量。

实测和预期计数

实测计数是样本中属于某个类别的实际观测值个数。

预期计数是预期的平均单元格频率(如果变量之间相互独立)。Minitab 通过将总行数和总列数的乘积除以观测值总数来计算预期计数。

解释

您可以比较输出表中每个单元格的实测值和预期值。在这些结果中,实测单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字。

如果两个变量相关,则一个变量的观测值分布因另一变量的类别而异。如果两个变量相互独立,则一个变量的观测值分布对另一变量的所有类别而言都相似。在此例中,在表格的第 1 列、第 2 行中,实测计数为 76,预期计数为 60.78。如果变量之间相互独立,则实测计数似乎比预期计数大得多。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
         
2764732155
  60.7850.9143.31 
         
3364034110
  43.1436.1330.74 
         
全部160134114408
单元格内容
      计数
      期望计数
标准化残差更适用于比较实测计数和预期计数。

表格百分比(行的 %、列的 %、总和的 %)

对于每个单元格,Minitab 会显示您选择的表格百分比。
% 行
表格行内每个单元格表示的百分比。Minitab 会通过将单元格计数除以总行数来计算每个单元格的行百分比。
% 列
表格列内每个单元格表示的百分比。Minitab 会通过将单元格计数除以总列数来计算每个单元格的列百分比。
总和的 %
每个单元格表示的总观测值数的百分比。Minitab 会通过将单元格计数除以总观测值数来计算每个单元格的总和百分比。

解释

使用表格百分比来了解类别之间的计数是如何分布的。

在这些结果中,单元格计数是每个单元格中的第一个数字。然后,行百分比、列百分比和总和的百分比分别对应于单元格中的后续数字。您可以选择显示这些百分比中的一个或多个。

例如,对于机器 1 和第 1 班次的数据:
  • 单元格计数为 48。
  • 行百分比为 33.57%,由 48 除以 143 所得。
  • 列百分比为 30.00%,由 48 除以 160 所得。
  • 总和的百分比为 11.76%,由 48 除以 408 所得。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  33.5732.8733.57100.00
  30.0035.0742.1135.05
  11.7611.5211.7635.05
         
2764732155
  49.0330.3220.65100.00
  47.5035.0728.0737.99
  18.6311.527.8437.99
         
3364034110
  32.7336.3630.91100.00
  22.5029.8529.8226.96
  8.829.808.3326.96
         
全部160134114408
  39.2232.8427.94100.00
  100.00100.00100.00100.00
  39.2232.8427.94100.00
单元格内容
      计数
      % 行
      % 列
      总和的 %

原始残差

原始残差是实测计数和预期计数之间的差值。
实测计数
实测计数是样本中属于某个类别的实际观测值个数。
期望计数

期望计数是变量独立的情况下预计单元格中的平均频率。Minitab 会计算预期计数(行和列合计乘积除以观测值总数)。

解释

您可以比较输出表格中的实测值和预期值。

在这些结果中,单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字,原始残差是每个单元格中的第三个数字。机器 2、第 1 个班次的原始残差最大,这表示在第 1 个班次使用的机器 2 上发现的预期缺陷和实际缺陷之间的差值最大。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
  -8.0780.0348.044 
         
2764732155
  60.7850.9143.31 
  15.216-3.907-11.309 
         
3364034110
  43.1436.1330.74 
  -7.1373.8733.265 
         
全部160134114408
单元格内容
      计数
      期望计数
      残差
标准化残差更适用于比较实测计数和预期计数。

标准化残差

标准化残差等于原始残差(或实测计数与预期计数的差值)除以预期计数的平方根。

解释

您可以比较输出表格中的标准化残差,以确定哪些变量类别在相对于样本数量的预期计数和实际计数之间存在的差异最大,并且似乎相关。例如,您可以评估输出表格中的标准化残差,以确定产生缺陷的机器和班次之间的关联。

在这些结果中,单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字,标准化残差是每个单元格中的第三个数字。正标准化残差表示不合格把手的数量比预期多。负标准化残差表示不合格把手的数量比预期少。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
  -1.07880.00501.2726 
         
2764732155
  60.7850.9143.31 
  1.9516-0.5476-1.7184 
         
3364034110
  43.1436.1330.74 
  -1.08670.64430.5889 
         
全部160134114408
单元格内容
      计数
      期望计数
      标准化残差

调整残差

调整残差就是原始残差(即实测计数和预期计数之间的差值)除以标准误的估计值。调整残差可用于解释因样本数量产生的变异。

解释

您可以比较输出表格中的调整残差以确定哪些类别在相对于样本数量的预期计数和实际计数之间的差异最大。例如,您可以确定哪个机器或班次的预期缺陷品数量和实际缺陷品数量之间的差异最大。

在这些结果中,单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字,调整残差是每个单元格中的第三个数字。调整残差为正数时,表示有缺陷的把手比预期多(已根据样本数量调整)。调整残差为负数时,表示有缺陷的把手比预期少(已根据样本数量调整)。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
  -1.71690.00761.8602 
         
2764732155
  60.7850.9143.31 
  3.1788-0.8485-2.5707 
         
3364034110
  43.1436.1330.74 
  -1.63090.91990.8117 
         
全部160134114408
单元格内容
      计数
      期望计数
      调整残差

卡方的贡献

Minitab 会显示每个单元格的卡方统计量贡献,从而量化每个单元格差异队总卡方统计量的贡献。

Minitab 通过将单元格的观测值与预期值的差值平方除以该单元格的预期值,来计算每个单元格对卡方统计量的贡献。卡方统计量是所有单元格的贡献值之和。

解释

在这些结果中,每个单元格的卡方总和就是 Pearson 卡方统计量,该值为 11.788。最大贡献来自第 1 个班次和第 3 个班次使用的机器 2。最小贡献来自使用机器 1 和 2 的第 2 个班次。

行: 机器 ID   列: 工作表列

第 1 个偏移第 2 个偏移第 3 个偏移全部
         
1484748143
  56.0846.9739.96 
  1.16370.00001.6195 
         
2764732155
  60.7850.9143.31 
  3.80880.29982.9530 
         
3364034110
  43.1436.1330.74 
  1.18090.41510.3468 
         
全部160134114408
单元格内容
      计数
      期望计数
      对卡方的贡献