クロス集計とカイニ乗の関連性の測度

関連性の測度表に示されるすべての統計量の定義と解釈について解説します。

フィッシャーの正確検定、p値

フィッシャーの正確検定は独立性の検定です。フィッシャーの正確検定は、期待セル度数が小さく、カイ二乗の近似値があまり良くない時に、役に立ちます。

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

p値を用いて、帰無仮説を却下するか却下できないかを判断し、変数の独立を示します。

解釈

変数が独立しているかどうかを特定するには、p値を有意水準と比較します。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には関連性が存在しない場合に、変数の間に関連性が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α: 変数には統計的に有意な関連性がある(H0却下)
p値が有意水準以下の場合は、帰無仮説を棄却し、変数の間に統計的に有意な関連性が存在すると結論付けます。
P値 > α: 変数に関連性があると結論付けることができない(H0却下失敗)
p値が有意水準より大きい場合は、変数は関連していると結論付けるのに十分な証拠を得られず、帰無仮説を棄却できません。

詳細は、フィッシャーの正確検定とはを参照してください。

マクネマーの検定

マクネマーの検定を用いて、対応のある比率が異なるかどうかを判断します。

解釈

推定差
Minitabは周辺比率間の差を計算します。
95% 信頼区間(CI)
Minitabは周辺確率間の差の95%の信頼区間を計算します。
95%の信頼区間は(95% CI)、周辺確率間の差の真の値を含む可能性が高い値の範囲です。
P
Minitabはp値を計算して、帰無仮説をテストします。
周辺確率に有意な差があるかどうかを判断するには、p値を有意水準(αまたはアルファと表されます)と比較して帰無仮説を評価します。帰無仮説から、周辺確率が等しいことがわかります。通常、0.05の有意水準が有効に機能します。0.05の有意水準は、実際には差が存在しないにもかかわらず、存在すると結論付ける可能性が5%であることを示しています。
P-value ≤ α: 周辺確率は統計的に異なる
p値が有意水準以下であれば、帰無仮説を棄却し、周辺確率が有意に異なると結論付けます。たとえば、前の確率は後の確率と違います。
P-value > α: 周辺確率には有意な差がない
p値が有意水準より大きい場合、周辺確率に有意な差があると結論付けるのに十分な証拠を得られず、帰無仮説を棄却できません。たとえば、前の確率は後の確率と違うと結論付けることはできません。

詳細は、マクネマーの検定を使用すべき理由を参照してください。

コクラン-マンテル-ヘンツェルの検定

コクラン-マンテル-ヘンツェル検定を使用して、第3のカテゴリ変数がある場合の2つの2値変数の条件的関連性を検定します。

Minitabは、有意かどうかを評価するために、複数の表にわたる共通オッズ比とp値を計算します。

解釈

共通のオッズ比
Minitabは関連性の強さを示す共通のオッズ比を計算します。
コクラン-マンテル-ヘンツェル統計量
コクラン-マンテル-ヘンツェル統計量は、関連性が統計的に有意であるかを示すのに用いられます。
自由度(DF)
コクラン-マンテル-ヘンツェル統計量は、自由度が1のカイ二乗の百分位と比較されます。
p値
Minitabはp値を計算して、帰無仮説をテストします。
p値を用いて、帰無仮説を却下するか却下できないかを判断し、第3のカテゴリ変数を条件とした2つの2値変数の独立を示します。

詳細は、コクラン-マンテル-ヘンツェル検定とはを参照してください。

クレイマーのV二乗

クレイマーのV2は、2つの変数(行変数と列変数)の間の関連性を計ります。クレイマーのV2値は0から1までの範囲です。クレイマーのV2のより大きな値は、変数の間のより強い関係を示し、V2のより小さな値は、弱い関係を示します。値がゼロの場合は、まったく関連していないことを示します。値が1の場合は、変数の間の関連性が非常に強力であることを示します。

κ

κによって、同じサンプルの評価時に、複数の評価者によって作成された名義または順位評価の一致度が測定されます。欠陥の程度を1~5段階で表したものなど、順序評価を用いている場合は、κ統計だけを利用するよりは順位カテゴリのための一致測度も利用する方が適切です。

解釈

κ統計の値の範囲は-1~+1です。値が高いほど一致度も高くなります。

次に例を示します。
  • κ = 1の場合、評価は完全に一致しています。
  • κ = 0の場合、一致は偶然の所産として期待されるものと同じです。
  • κ < 0は、一致の度合いが偶然の所産として期待されるより弱いときですが、これはめったに起こりません。

グッドマン-クラスカルのλおよびτ(G)

グッドマン-クラスカルのλとτは、一方の変数の値がわかっているとき、他方の値を正確に推測または予測する能力に基づいて、関連の強さを測定します。λはモーダル確率に基づき、τはランダムなカテゴリ指定に基づきます。

解釈

ラムダ(λ)
λは、従属変数(列変数または行変数)の確率が、他の変数(行変数または列変数)の値が与えられた場合に何パーセント向上するかを示します。
λの値の範囲は0~1です。0値は、独立変数が従属変数のカテゴリの予測を改善しないことを意味します。1値は、独立変数が従属変数のカテゴリを完全に予測することを意味します。0.5値は、予測エラーが50%減少したことを意味します。
タウ(τ)
τは、従属変数(行変数または列変数)の予測可能性が、その他の変数(行変数または列変数)の値が与えられた場合に何パーセント向上するかを示します。グッドマン-クラスカルのτは、グッドマン-クラスカルのλと同じですが、周辺比率または条件付き比率によって指定される割り当て確率に基づいてτ統計量が計算される点が異なります。
τの値の範囲は−1(パーセントの負の関連性)から+1(パーセントの正の関連性)までです。0値は関連性のないことを示しています。

詳細は、グッドマン-クラスカルの統計量とはを参照してください。

順位カテゴリのための一致測度(S)

一致するペアと一致しないペアの数
一致するペアと一致しないペアを使用して観測値のペア間の関係を表せます。一致するペアと一致しないペアの計算ではデータが順位データとして扱われるため、目的の用途が順位データに適したものである必要があります。一致するペアと一致しないペアの数は、2つの順位変数間の関連を測定するケンドルのτの計算に使用されます。
詳細は、一致するペアと一致しないペアとはを参照してください。
グッドマン-クラスカルのγ
グッドマン-クラスカルのγは、一致するペア数から一致しないペアの数を差し引いて、同順位の場合を除くペア総数で割ったものを示します。グッドマン-クラスカルのγを使用して順位変数間の関連性を測定します。
|γ|=1の場合は完全な関連性が存在します。順位ロジスティック回帰または2値ロジスティック回帰では、XとYが独立している場合、γ=0です。
詳細は、グッドマン-クラスカルの統計量とはを参照してください。
ソマーズのD
ソマーズのDは、変数のペア間の関係の強さと方向を測定します。ソマーズのDの値の範囲は、-1(すべてのペアが不一致)~1(すべてのペアが一致)です。
行変数が従属変数である場合の値と、列変数が従属変数である場合の値の、2つのDの値が表示されます。どちらが分析に適しているかを決める必要があります。
ケンドルのτb
ケンドルのτbはクロス集計で使用され、2つの順序変数間の関連性を計ります。
ケンドルのτbの値の範囲は0~+1です。正の値は、両方の変数が共に増加することを示します。負の値は、両方の変数が共に減少することを示します。

ピアソンのrとスピアマンのρ

ピアソンのrとスピアマンのρを用いて、順位カテゴリのある2つの変数の間の関連性を評価します。順位カテゴリは小、中、大など、自然な順位になります。

係数の範囲は-1~+1の値です。係数の絶対値が大きいほど、変数間の関係は強まります。絶対値1は完全な線形関係を意味し、値0は順位関係が存在しないことを意味します。その中間の値での相関関係の強度は、個々の場合の目的と要件に応じて解釈します。

詳細は、順位カテゴリのためのスピアマンのrhoとピアソンのrの理解を参照してください。