简单对应分析的频率和卡方距离

请查找相关定义和解释指导,了解针对简单对应分析的频率和卡方距离提供的每个统计量。

列联表

列联表根据多个类别变量来计数观测值。该表中的行和列对应于这些类别变量。该表包含变量每个水平的边际合计。

简单对应分析的列联表是一种计数两个变量观测值的双因子表。您还可以通过使用组合子对话框交叉变量并创建双因子表的行和/或列,从而对三个或四个变量的观测值分类。

解释

使用列联表可查看按照行类别和列类别为每个单元格定义的观测频率。使用列合计和行合计可查看各个类别的总频率。

列联表 A B C D E 合计 地质学 3.000 19.000 39.000 14.000 10.000 85.000 生物化学 1.000 2.000 13.000 1.000 12.000 29.000 化学 6.000 25.000 49.000 21.000 29.000 130.000 动物学 3.000 15.000 41.000 35.000 26.000 120.000 物理学 10.000 22.000 47.000 9.000 26.000 114.000 工程学 3.000 11.000 25.000 15.000 34.000 88.000 微生物学 1.000 6.000 14.000 5.000 11.000 37.000 植物学 0.000 12.000 34.000 17.000 23.000 86.000 统计学 2.000 5.000 11.000 4.000 7.000 29.000 数学 2.000 11.000 37.000 8.000 20.000 78.000 合计 31.000 128.000 310.000 129.000 198.000 796.000

以下双因子列联表显示每个学术科目和经费类别(A、B、C、D、E)的研究人员观测计数。“合计”列表明大多数研究人员来自“化学”(130)、“动物学”(120) 和“物理学”(114) 领域。“合计”行表明大多数研究人员归类在经费类别 C (310) 下。对于单元格计数,归类到经费类别 C 下的“化学”领域的研究人员具有最高的观测频率 (49)。

预期频率

预期频率是变量独立的情况下您预计单元格中观测值的平均计数。Minitab 会计算预期计数(行和列合计乘积除以观测值总数)。

期望频率 A B C D E 地质学 3.310 13.668 33.103 13.775 21.143 生物化学 1.129 4.663 11.294 4.700 7.214 化学 5.063 20.905 50.628 21.068 32.337 动物学 4.673 19.296 46.734 19.447 29.849 物理学 4.440 18.332 44.397 18.475 28.357 工程学 3.427 14.151 34.271 14.261 21.889 微生物学 1.441 5.950 14.410 5.996 9.204 植物学 3.349 13.829 33.492 13.937 21.392 统计学 1.129 4.663 11.294 4.700 7.214 数学 3.038 12.543 30.377 12.641 19.402

下面的预期频率表显示假定经费和学术科目独立的情况下,每个学术科目和经费类别(A、B、C、D、E)中研究人员的预期计数。由于大多数研究人员来自“化学”领域,大多数系属于经费类别 C,这些类别的组合具有最高的预期值(约为 51)。

观测 - 预期频率

观测 - 预期频率是单元格中实际观测值计数和变量独立的情况下您预期的单元格中观测值计数之间的差值。

解释

使用观测频率和预期频率可找出数据中存在可能相关性的证明。如果两个变量相关,则一个变量的观测值分布因另一变量的类别而异。因此,观测频率和预期频率之间的差值量值相对较大。如果两个变量相互独立,则一个变量的观测值分布对另一变量的所有类别而言都相似。因此,观测频率和预期频率之间的差值量值相对较小。

观测 - 期望频率 A B C D E 地质学 -0.310 5.332 5.897 0.225 -11.143 生物化学 -0.129 -2.663 1.706 -3.700 4.786 化学 0.937 4.095 -1.628 -0.068 -3.337 动物学 -1.673 -4.296 -5.734 15.553 -3.849 物理学 5.560 3.668 2.603 -9.475 -2.357 工程学 -0.427 -3.151 -9.271 0.739 12.111 微生物学 -0.441 0.050 -0.410 -0.996 1.796 植物学 -3.349 -1.829 0.508 3.063 1.608 统计学 0.871 0.337 -0.294 -0.700 -0.214 数学 -1.038 -1.543 6.623 -4.641 0.598

在此表中,“动物学”和经费类别 D (15.553) 以及“工程学”和经费类别 E (12.111) 的观测计数和预期计数之间的差值量值相对较大。对于这些单元格,观测计数比变量独立的情况下您预期的计数要大。对于“地质学”和经费类别 E (-11.143),差值量值也相对较大。对于此单元格,观测计数比变量独立的情况下您预期的计数要小。因此,您可以得出这样的结论:相较于预期,相当多的“工程学”系没有获得经费;相较于预期,相当少的“地质学”系没有获得经费。

卡方距离

Minitab 将每个单元格对卡方统计量的贡献显示为卡方距离。每个单元格的卡方距离量化每个单元格差异对总卡方统计量的贡献。

Minitab 通过将单元格的观测值与预期值的差值平方除以该单元格的预期值,来计算每个单元格对卡方统计量的贡献。总卡方是所有单元格的这些值之和。

解释

可以比较每个单元格的卡方距离来评估哪些单元格对总卡方贡献最大。如果观测单元格频率和预期单元格频率有很大差异,则单元格的卡方值较大。因此,如果单元格中卡方距离较大,表明行类别与列类别之间的关联性比偶然预计的更强。

卡方距离 A B C D E 合计 地质学 0.029 2.080 1.050 0.004 5.873 9.036 生物化学 0.015 1.521 0.258 2.913 3.176 7.882 化学 0.173 0.802 0.052 0.000 0.344 1.373 动物学 0.599 0.957 0.703 12.438 0.496 15.194 物理学 6.964 0.734 0.153 4.859 0.196 12.906 工程学 0.053 0.702 2.508 0.038 6.700 10.001 微生物学 0.135 0.000 0.012 0.166 0.351 0.663 植物学 3.349 0.242 0.008 0.673 0.121 4.393 统计学 0.671 0.024 0.008 0.104 0.006 0.814 数学 0.354 0.190 1.444 1.704 0.018 3.710 合计 12.343 7.252 6.196 22.899 17.282 65.972

在此表中,“动物学”和经费类别 D 的单元格是 12.438,这对总卡方 (65.972) 贡献最大。在行类别中,“动物学”(15.194)、“物理学”(12.906) 和“工程学”(10.001) 对总卡方贡献最大。在列类别中,经费级别 D (22.899) 和 E (17.282) 对总卡方贡献最大。

相对惯量

单元格中的卡方值除以列联表的总频率即可得到单元格惯量。所有单元格惯量之和是总惯量,或者仅仅是惯量。单元格惯量除以总惯量即可得到单元格的相对惯量。行的惯量之和除以总惯量即可得到行的相对惯量。列的单元格惯量之和除以总惯量即可得到列的相对惯量。

解释

使用相对惯量可评估类别之间的相关性强度以及对数据中变异的贡献。通常,值越高,表明相关性越强,占数据中预期值的总变异比率越大。

相对惯量 A B C D E 合计 地质学 0.000 0.032 0.016 0.000 0.089 0.137 生物化学 0.000 0.023 0.004 0.044 0.048 0.119 化学 0.003 0.012 0.001 0.000 0.005 0.021 动物学 0.009 0.015 0.011 0.189 0.008 0.230 物理学 0.106 0.011 0.002 0.074 0.003 0.196 工程学 0.001 0.011 0.038 0.001 0.102 0.152 微生物学 0.002 0.000 0.000 0.003 0.005 0.010 植物学 0.051 0.004 0.000 0.010 0.002 0.067 统计学 0.010 0.000 0.000 0.002 0.000 0.012 数学 0.005 0.003 0.022 0.026 0.000 0.056 合计 0.187 0.110 0.094 0.347 0.262 1.000

“相对惯量”表显示每个单元格对总卡方统计量的相对贡献。单元格中的相对惯量越高,行类别和列类别之间的相关性越大。在这个表格中,“动物学”和经费类别 D 的单元格相对惯量最高 (0.189),这反映了表格中的最强相关性。该表格还显示每行和每列的总相对惯量。

使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策