交叉分组表和卡方的数据注意事项

为了确保结果有效,请在收集数据、执行分析和解释结果时考虑以下准则。

该样本应随机选择

随机样本可用于概括总体,即推断。如果数据不是随机收集的,则结果可能无效。

每个观测值都应当独立于所有其他观测值

观测值的独立性是相关性卡方检验的关键假设。

必须将所有数据都分类为互斥的行和列类别

当变量类别重叠时,无法执行相关性卡方检验。因此,必须将每个观测值都分为一个且只能是一个类别。

预期计数不得太小。
每个样本都应足够大,才能使每个类别中的观测结果的几率合理。如果预期计数太小,检验的 p 值可能不精确。Minitab 会指示结果中的预期计数是否太小。
如果某个类别的预期计数太小,您可以将该类别与相邻类别合并以获得最小预期计数。 只有在必要时,才可以合并类别,因为合并类别会丢失信息。 或者您可以使用 Fisher 精确检验,该检验对于所有样本数量都准确。有关更多信息,请转到什么是 Fisher 精确检验?