实测计数是样本中属于某个类别的实际观测值个数。
预期计数是预期的平均单元格频率(如果变量之间相互独立)。Minitab 通过将总行数和总列数的乘积除以观测值总数来计算预期计数。
您可以比较输出表格中每个单元格的实测值和预期值。在这些结果中,实测单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字。
如果两个变量相关,则一个变量的观测值的分布是否会因另一个变量的类别而异。如果两个变量不相关,则一个变量的观测值的分布将类似于另一个变量的所有类别的分布。在此例中,表格的第 1 列、第 2 行显示,观测计数为 76,预期计数为 60.78。如果变量之间不相关,则实测计数似乎比预期计数大得多。
可以使用边际计数了解计数在类别之间是如何分布的。
在这些结果中,行 1 的总数为 143,行 2 的总数为 155,行 3 的总数为 110。所有行的总和为 408。列 1 的总数为 160,列 2 的总数为 134,列 3 的总数为 114。所有列的总和为 408。
Minitab 会显示每个单元格的卡方统计量贡献,从而量化每个单元格差异队总卡方统计量的贡献。
Minitab 通过将单元格的观测值与预期值的差值平方除以该单元格的预期值,来计算每个单元格的卡方统计量的贡献。卡方统计量是所有单元格的这些值的总和。
卡方 | 自由度 | P 值 | |
---|---|---|---|
Pearson | 11.788 | 4 | 0.019 |
似然比 | 11.816 | 4 | 0.019 |
Pearson 卡方统计量 (χ2) 涉及实测频率与预期频率的平方差。
似然比卡方统计量 (G2) 基于实测频率与预期频率的比值。
使用卡方统计量检验变量之间是否关联。
在这些结果中,两个卡方统计量都非常相似。可使用 p 值来评估卡方统计量的显著性。卡方 | 自由度 | P 值 | |
---|---|---|---|
Pearson | 11.788 | 4 | 0.019 |
似然比 | 11.816 | 4 | 0.019 |
当预期计数较少时,您的结果可能有误导性。有关更多信息,请参见相关性的卡方检验的数据注意事项
自由度 (DF) 是有关统计量的独立信息的条数。表格的自由度为(行数 – 1)乘以(列数 – 1)。
Minitab 使用自由度来确定与检验统计量相关的 p 值。
在这些结果中,自由度 (DF) 为 4。
卡方 | 自由度 | P 值 | |
---|---|---|---|
Pearson | 11.788 | 4 | 0.019 |
似然比 | 11.816 | 4 | 0.019 |
p 值是一个概率,用来度量否定原假设的证据。概率越低,否定原假设的证据越充分。
使用 p 值来确定可以否定还是无法否定原假设,以表明两个类别变量之间不存在关联。
Minitab 使用卡方统计量确定 p 值。
当任何预期计数小于 1 时,Minitab 不会显示 p 值,因为这些结果可能无效。
在这些结果中,p 值 = 0.019。由于 p 值小于 α,因此您可以否定原假设。您可以断定变量之间是关联的。
卡方 | 自由度 | P 值 | |
---|---|---|---|
Pearson | 11.788 | 4 | 0.019 |
似然比 | 11.816 | 4 | 0.019 |
期望计数是变量独立的情况下预计单元格中的平均频率。Minitab 会计算预期计数(行和列合计乘积除以观测值总数)。
您可以比较输出表格中的实测值和预期值。
标准化残差等于原始残差(或实测计数与预期计数的差值)除以预期计数的平方根。
您可以比较输出表格中的标准化残差,以确定哪些变量类别在相对于样本数量的预期计数和实际计数之间存在的差异最大,并且似乎相关。例如,您可以评估输出表格中的标准化残差,以确定产生缺陷的机器和班次之间的关联。
调整残差就是原始残差(即实测计数和预期计数之间的差值)除以标准误的估计值。调整残差可用于解释因样本数量产生的变异。
您可以比较输出表格中的调整残差以确定哪些类别在相对于样本数量的预期计数和实际计数之间的差异最大。例如,您可以确定哪个机器或班次的预期缺陷品数量和实际缺陷品数量之间的差异最大。