属性の一致性分析のκ統計量

κ統計量の定義と解釈について解説します。

このトピックの内容

応答
κ
標準誤差κ
z値
P(vs > 0)

応答

データのカテゴリ水準。たとえば、検査者が1～5のスケールを使用する場合、応答は1～5です。

κ

κは、検査者の最大一致回数（偶然の一致に対して修正）に対する、検査者の一致回数（偶然の一致に対して修正）の比です。

評価者が同じサンプルを評価する場合に、複数の評価者によって作成された名義または順位評価の一致度を評価するには、κ統計量を使用します。

Minitabでは、FleissのκとCohenのκを計算できます。Cohenのκは2人の評価者の間の評価一致を測定するためによく使用される統計量です。Fleissのκは、Cohenのκを3人以上の評価者に使用できるように一般化したものです。Minitabの属性の一致性分析では、デフォルトでFleissのκが計算されます。

次の要件が満たされた場合には、Cohenのκを計算できます。

検査者内の一致に対してCohenのκを計算するには、各検査者に対して2回の試行がある必要があります。
検査者間の一致に対してCohenのκを計算するには、1回の試行で2人の検査者がいる必要があります。
各検査者対標準およびすべての検査者対標準の一致に対してCohenのκを計算するには、各サンプルに対して標準を指定する必要があります。

解釈

κ統計の値の範囲は-1～+1です。次のように、値が高いほど一致度も高くなります。

κ = 1の場合、評価は完全に一致しています。
κ = 0の場合、一致は偶然の所産として期待されるものと同じです。
κ < 0は、一致の度合いが偶然の所産として期待されるより弱いときですが、これはめったに起こりません。

AIAGは、κ値が0.75以上のときに一致度が高いとしています。ただし、0.90以上など、より高いκ値が望ましいです。

欠陥の程度を1～5段階で表したものなど、順序評価を用いている場合は、κ統計だけを利用するよりは順位を考慮するKendall係数も利用する方が適切です。

詳細については、「κ統計量とKendallの係数」を参照してください。

標準誤差κ

推定されたκ統計の標準誤差は、推定精度の指標となります。標準誤差が小さいほど、推定値は正確です。

z値

z値とは、近似正規検定統計量です。z値はp値の決定に使われます。

P(vs > 0)

p値は帰無仮説を棄却するための証拠を測定する確率です。p値が低いほど帰無仮説を棄却するための強力な証拠となります。

次の帰無仮説を棄却するかどうかを決定するには、κのp値を使用します。

検査者内のH₀: 検査者内の一致は偶然の所産である
各検査者対標準のH₀: 検査者の評価と標準との一致は偶然の所産である
検査者間のH₀: 検査者間の一致は偶然の所産である
すべての検査者対標準のH₀: すべての検査者の評価と標準との一致は偶然の所産である

Minitabでは、z値を使用してp値を決定します。

解釈

一致が偶然の所産かどうかを特定するには、p値を有意水準と比較します。通常、0.05の有意水準（αまたはアルファとも呼ばれます）が有効に機能します。0.05の有意水準は、実際には検査者が一致していないにもかかわらず一致していると結論付ける可能性が5%であることを示しています。

p値 ≤ α: 検査者の一致は偶然の所産ではない（H₀を棄却）: p値が有意水準以下であれば、帰無仮説を棄却し、検査者の一致は偶然の所産によるものとは有意に異なると結論付けます。
p値 > α: 検査者の一致は偶然の所産である（H₀を棄却できない）: p値が有意水準より大きい場合、検査者の一致は偶然の所産によるものとは有意に異なると結論付けるのに十分な証拠を得られず、帰無仮説を棄却できません。