属性一致性分析的 kappa 统计量的方法和公式

请选择您所选的方法或公式。

关于本主题

Cohen 的 kappa 统计量（标准未知）
Cohen 的 kappa 统计量（标准已知）
检验 Cohen 的 kappa 的显著性
Fleiss 的 kappa 统计量（标准未知）
检验 Fleiss 的 kappa 的显著性（未知标准）
Fleiss 的 kappa 统计量（标准已知）
测试 Fleiss 的 kappa 的显著性（标准已知）

Cohen 的 kappa 统计量（标准未知）

如果分类是名义上的，可使用 Cohen 的 kappa 统计量。如果标准未知的情况下，您选择获取 Cohen 的 kappa，Minitab 将在数据符合以下条件时计算统计量：

检验员自身 - 一个检验员正好有两个试验
检验员之间 - 正好有两个检验员，每个检验员仅有一个试验

对于特定的响应值，可通过组合某一类中不等于该值的所有响应来计算 kappa。然后，可以使用 2X2 表计算 kappa。

公式

如果实际标准未知，则 Minitab 可通过以下公式评估 Cohen 的 kappa：

	试验 B（或检验员 B）
试验 A（或检验员 A）	1	2	...	k	合计
1	p₁₁	p₁₂	...	p_1k	p₁₊
2	p₂₁	p₂₂	...	p_2k	P₂₊
....
k	p_k1	p_k2	...	p_kk	p_k+.
合计	p_.+1	p_.+2	...	p_.+k	1

表示法

项	说明
P_o	观测到的一致性比例
p_ii	双向表对角线中的每个值
P_e	k 个检验员一致的预期次数比例
n_ij	第 i 行和第 j 列中的样本数
N	样本总数

Cohen 的 kappa 统计量（标准已知）

如果分类是名义上的，可使用 Cohen 的 kappa 统计量。如果在标准已知的情况下，您选择获取 Cohen 的 kappa，Minitab 将使用以下公式计算统计量。

具有已知标准的试验一致性的 kappa 系数将是这些 kappa 系数的均值。

公式

如果实际标准已知，则首先使用每个试验的数据和已知标准计算 kappa。

	标准
试验 A	1	2	...	k	合计
1	p₁₁	p₁₂	...	p_1k	p₁₊
2	p₂₁	p₂₂	...	p_2k	P₂₊
....
k	p_k1	p_k2	...	p_kk	p_k+.
合计	p_.+1	p_.+2	...	p_.+k	1

表示法

项	说明
P_o	观测到的一致性比例
p_ii	双向表对角线中的每个值
P_e	k 个检验员一致的预期次数比例
n_ij	第 i 行和第 j 列中的样本数
N	样本总数

检验 Cohen 的 kappa 的显著性

要检验原假设，即评级之间相互独立（以使 kappa = 0），请使用：

z = kappa / kappa 标准误

这是一个单侧检验。在原假设下，z 遵循标准正态分布。如果 z 明显大于 α 临界值，则否定该假设。

公式

每个试验和标准的 kappa 标准误是：

表示法

项	说明
P_e	k 个检验员一致的预期次数比例
N	样本总数

Fleiss 的 kappa 统计量（标准未知）

计算 kappa 统计量有两种情况。

第 1 种情况：每个检验员自身的一致性: 计算表示每个检验员自身一致性的 kappa 系数。; 这种情况下，m 等于每个检验员自身的试验数，假定 m 大于 1。分析员对每个检验员自身的 m 个试验之间的一致性进行检查。在此，我们假定每个试验完成的条件是检验员不记得对前面试验的评级。
第 2 种情况：所有检验员之间的一致性: 计算表示所有检验员之间一致性的 kappa 系数。; 这种情况下，m 等于所有检验员的试验总数。假定检验员数大于 1，试验数可能为 1 或大于 1。分析员对所有检验员的一致性进行检查。

整体 kappa 的公式

定义 x_ij 成为样本 i 对类别 j 的评级数，其中 i 介于 1 到 n，j 介于 1 到 k。

整体 kappa 的系数由以下公式定义：

其中：

P_o 是 m 个试验之间配对一致性的观测到的比率。

如果各个试验的评级之间是相互独立的，则 P_e 是一致性的预期比率。

p_j 表示类别 j 中评级的整体比率。

将 P_o 和 P_e 替换成 K，则通过以下公式估算整体 kappa 系数：

其中：

项	说明
k	是类别总数
m	是试验数。对于第 1 种情况，m 等于每个检验员的试验数，对于第 2 种情况，m 等于所有检验员的试验数。
n	样本数
x_ij	样本 i 对类别 j 的评级数

单个类别的 kappa 的公式

有关测量关于分类到 k 个类别其中之一的一致性，即第 j 个，有人可能会合并所有类别，而非使用当前的方法，分类到单个类别并应用上述二次方程。第 j 个类别的 kappa 统计量的结果公式是：

其中：

项	说明
k	是类别总数
m	是试验数。对于第 1 种情况，m 等于每个检验员的试验数，对于第 2 种情况，m 等于所有检验员的试验数。
n	样本数
x_ij	样本 i 对类别 j 的评级数

检验 Fleiss 的 kappa 的显著性（未知标准）

原假设 H₀ 为 kappa = 0。备择假设 H₁ 为 kappa > 0。

在原假设下，Z 大致呈正态分布，用于计算 p 值。

公式

要检验 kappa 是否大于> 0，请使用以下 Z 统计量：

Var (K) 通过以下公式计算得出：

要检验第 j 类的 kappa 是否大于 0，请使用以下 Z 统计量：

Var (K_j) 通过以下公式计算的出：

表示法

项	说明
K	整体 kappa 统计量
K_j	第 j 类的 kappa 统计量
k	类别总数
m	是试验数。对于第 1 种情况，m 等于每个检验员的试验数，对于第 2 种情况，m 等于所有检验员的试验数。
n	样本数
x_ij	样本 i 对类别 j 的评级数

Fleiss 的 kappa 统计量（标准已知）

当已知每个样本标准评级时，使用以下步骤计算整体 kappa 和特定类别的 kappa。

假定有 m 个试验。

注意

查看来自 Fleiss 的 kappa 统计量的公式（标准未知）。

针对每个试验，使用来自试验的评级和标准给定的评级计算 kappa。换句话说，将标准当作是另一个试验，使用这两个试验的未知标准 kappa 公式来评估 kappa。.
对所有 m 个试验重复进行该计算。
现在，您具有 m 个整体 kappa 值和 m 个特定类别值的 kappa 值。

具有已知标准的整体 kappa 将等于所有 m 个整体 kappa 值的平均值。

同样，具有已知标准的特定类别的 kappa 将等于特定类别值的所有 m 个 kappa 的平均值。

测试 Fleiss 的 kappa 的显著性（标准已知）

原假设，H₀ 是 kappa = 0。备择假设，H₁ 是 kappa > 0。