简单对应分析的方法

简单对应分析对列联表执行加权主分量分析。如果列联表有 r 行和 c 列,基本维度数将是 (r − 1) 或 (c − 1) 中的较小者。对于主分量,变异性会进行分割,但不会分割总方差,简单对应分析会分割 Pearson χ2 统计量(通常是 χ2 相关性检验中计算的同一统计量)。

传统意义上,对应分析使用 χ2 / n,这称为惯量或总惯量,而不使用 Χ2。与所有主分量相关的惯量合计为总惯量。理想情况下,第一个、前两个或前三个分量占总惯量的大部分比率。

主分量(亦称为主轴)跨低维子空间。选择了第一个主轴,以便在总惯量中占最大比例;选择了第二个主轴,以便在剩余惯量中占最大比例,以此类推。第一个主轴跨最佳(即,最靠近使用相应度量的剖面)单维子空间;前两个主轴跨最佳二维子空间;以此类推。这些子空间进行嵌套,这意味着最佳单维子空间是最佳二维子空间的一个子空间,以此类推。

行剖面 i 和分量(轴) k 的主坐标是行剖面 i 到分量 k 投影的坐标。分量 k 的主坐标除以第 k个惯量的平方根即可得到分量 k 的行标准化坐标。

同样地,列剖面 j 和分量 k 的主坐标是列剖面 j 到分量 k 投影的坐标。分量 k 的列主坐标除以第 k个惯量的平方根即可得到分量 k 的列标准化坐标。

列联表可以根据行剖面或列剖面进行分析。行剖面是根据列联表中的计数计算而来的一列行比率。具体地说,行 i 的剖面是 (ni1 / ni., ni2 / ni., ... , nic / ni.)。列剖面是一列列比率,其中 nij, 是表格的行 i 和列 j 的频率,ni. 是行 i 的频率之和。具体地说,列 j 的剖面是 (n1j / n.j, n2j / n.j, ... , nrj / n.j),其中 n.j 是列 j 中的频率之和。

这两项分析在数学上是等效的。使用哪种分析取决于您的应用。在很多时候,研究人员对研究行剖面彼此之间的差异或列剖面彼此之间的差异很感兴趣。

行剖面是长度 c 的向量,因此处于 c 维空间中(同样地,列剖面处于 r 维空间中)。由于此维度通常过高而导致很难解释,您应尽力找出靠近所有行剖面点(或列剖面点)的低维(最好不超过两个或三个)子空间。然后,您可以将剖面点投影到此子空间,并研究投影。如果投影靠近剖面,则说明您没有丢失很多信息。在两个或三个维度中进行处理可让您更轻松地研究数据,尤其是,可让您检查图。此过程类似于选择少量的主分量来汇总连续数据的变异性。

如果 d 等于 (r − 1) 和 (c − 1) 中的较小者,那么行剖面(或对等的列剖面)将处于全 c 维空间(或对等的全 r 维空间)的 d 维子空间中。因此,最多有 d 个主分量。