κによって、同じサンプルの評価時に、複数の評価者によって作成された名義または順位評価の一致度が測定されます。
たとえば、ある特定の病気があるかどうかの診断を2人の医師が45人の患者に対して実施しました。病気の有無に関する2人の医師の診断はどの程度一致するでしょうか? 名義評価の別の例として、検査者間でのテレビ画面の故障発見度が考えられます。検査者ごとの気泡、くぼみ、および汚れなどの分類は、一貫して一致するでしょうか?
AIAG1では、k値が少なくとも0.75あれば、良好な一致であると述べています。ただし、0.90などのより高いκ値のほうが望ましい値です。
欠陥の程度を1~5段階で表したものなど、順序評価を用いている場合は、κ統計だけを利用するよりはKendall係数も利用する方が適切です。
データが次の要件を満たす場合には、Cohenのκが計算されます。
FleissのκおよびCohenのκでは、一致が偶然に発生する確率を推定するのに異なる方法が用いられます。Fleissのκでは、検査者のグループから検査者がランダムに選ばれることを前提とします。Cohenのκでは、特定の検査者が選ばれ、検査者は変わらないことを前提とします。したがって、FleissのκとCohenのκでは、一致確率の推定が異なります。
Kendallの一致係数は、同じサンプルの評価時に、複数の測定者によって作成された順序評価の関連度を表します。Kendallの一致係数は一般的に、属性の一致分析で使用します。
Kendall の係数値の範囲は 0 から 1 です。値が高くなるほど、関連の度合いは強くなります。通常、Kendallの係数が0.9以上であれば、非常に良好と言えます。Kendallの係数が高い、または有意である場合、検査者はサンプルの評価に本質的に同じ基準を用いたと判定できます。
各サンプルの既知の評定をMinitabに入力すると、Kendallの相関係数も計算されます。相関係数は、各検査者と既知の標準の一致度を示すために各検査者に適用され、全体的な係数は検査者全員と標準の一致度を表します。相関係数は、検査者の評価に一貫性があっても正確かどうかを判断するのに役立ちます。
Kendall の係数値の範囲は -1 から 1 です。正の値は、正の関連性を示します。負の値は、負の関連性を示します。値が高くなるほど関連の度合いは強くなります。
p値は、帰無仮説(H0)が真である場合に、特定のKendallの相関係数でサンプルが得られる尤度を提供します。P値があらかじめ設定されている有意水準(α水準)以下の場合、帰無仮説を棄却して対立仮説を選択します。
κ統計は評定間の絶対一致を表すの対し、Kendallの係数は評定間の関連性を測定します。したがって、すべての誤判別はκ統計では同等に扱われますが、Kendallの係数では同等に扱われません。たとえば、Kendallの係数では、「完璧」(評定 = 5)な対象を「不良」(評定 = 1)と評価するほうが、「非常に良好」(評定 = 4)と評価するよりも誤判別の影響が重大であると見なされます。