什么是卡方统计量?

卡方统计量可度量数据分布与所选择的预期或假设分布之间的差异。例如,可用于:
  • 检验类别变量之间的独立性或确定类别变量之间的关联性。例如,如果有一个按选举人性别分类的选举结果的双因子表,卡方统计量可帮助确定选票是否与选举人的性别无关,或者在选票与性别之间是否存在关联。如果与卡方统计量相关联的 p 值小于选定的 α,检验将否定两个变量彼此独立的原假设。
  • 确定某个统计模型能否充分拟合数据。如果与卡方统计量相关联的 p 值小于选定的 α,检验将否定模型与数据相拟合的原假设。

对于类别数据,Minitab 可以报告每个类别对卡方值的贡献,从而量化每个类别差异对总卡方值的贡献。例如,如果一个拟合优度检验否定了原假设,则这个结果是因为所有类别与预期稍有差异还是因为有一个类别与其预期极大不同导致的?例如,假设您预计一个大型停车场内容纳了 100 辆车,其中有 50 辆轿车、27 辆卡车和 23 辆面包车,但是实际上有 61 辆轿车、16 辆卡车和 23 辆面包车。“轿车”和“卡车”类别与预期不符,但“面包车”与预期相符。因此,“面包车”并不影响所生成的卡方值;数据中的所有差异均来自“轿车”和“卡车”类别。

注意

在计算卡方统计量时,Minitab 不使用 Yates 校正因子。