クラスカル-ワリス検定のすべての統計量を解釈する

Kruskal-Wallisで使用されるすべての統計量の定義と解釈について解説します。

N

サンプルサイズ(N)は、各グループに含まれる観測値の合計数です。

解釈

サンプルサイズは、信頼区間と検定の検出力に影響します。

通常、サンプルサイズが大きいほど信頼区間が狭くなります。また、サンプルサイズが大きいほど、検定での差の検出力が高くなります。詳細は、検出力とはを参照してください。

中央値

中央値はデータセットの中間点です。この中間点の値は、観測値の半分がその値より上にあり、観測値の半分がその値より下にあるという点です。中央値は、観測値に順位付けし、順位付けされた順序での順位[N + 1] / 2にある観測値を検出することによって算定されます。データに含まれる観測値の数が偶数の場合、その中央値は、N/2および[N/2] + 1の数で順位付けされた観測値の平均値です。

解釈

サンプル中央値は、各グループの母集団中央値の推定値です。全体の中央値は、すべての観測値の中央値です。

平均順位

平均順位は、各サンプル内のすべての観測値の順位の平均です。Minitabでは、平均順位を使用して、クラスカル-ワリス検定の検定統計量であるH値を計算します。

平均順位を計算するため、Minitabにより結合されたサンプルに順位がつけられます。最小観測値には順位1が、2番目に小さな観測値には順位2が割り当てられ、以下同様に順位が割り当てられます。2つ以上の観測値が結合される場合は、各結合観測値に平均順位が割り当てられます。サンプルごとに平均順位が計算されます。

解釈

グループの平均順位が全体的な平均順位より上位の場合、そのグループの観測値は他のグループの観測値より高くなる傾向があります。

Z値

Z値は、すべての観測値の平均順位に対する各グループの平均順位の比較を示します。

解釈

各グループのZ値を次のように解釈します。
  • 絶対値が大きいほど、全体の平均順位とグループの平均順位の差が大きくなります。
  • 負のZ値は、グループの平均順位が全体の平均順位より低いことを示します。
  • 正のZ値は、グループの平均順位が全体の平均順位より高いことを示します。

帰無仮説と対立仮説

帰無仮説と対立仮説は、ある母集団についての相互に排他的な2つの仮説です。仮説検定手法では、サンプルデータを用いて帰無仮説を棄却するかどうかを判断します。
帰無仮説
帰無仮説では母集団パラメータ(平均や標準偏差など)は仮説値に等しいと仮定します。帰無仮説とは多くの場合、前回の分析や専門知識を基にした最初の主張を指します。
対立仮説
対立仮説では、母集団パラメータは帰無仮説の仮説値よりも小さい、大きい、異なると仮定します。対立仮説とは、真であると確信できる、または真であることの証明が期待できる仮説を指します。

DF

自由度(DF)は、データ内のグループ数から1を差し引いた数と等しくなります。帰無仮説では、カイ二乗分布により、指定した自由度で検定統計量の分布を近似します。Minitabでは、カイ二乗分布を使用してこの検定のp値を推定します。

H値

Hは、クラスカル-ワリス検定での検定統計量です。帰無仮説では、カイ二乗分布によってHの分布を近似します。この近似は、含まれる観測値の数が5より少ないグループが存在しない場合、ほぼ正確です。

解釈

Minitabで検定統計量を使用して計算されるp値に基づいて、項およびモデルの統計的有意性を決定します。p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

大きさが十分な検定統計量は、中央値間の少なくとも1つの差が統計的に有意であることを示します。

その検定統計量を使用して、帰無仮説を棄却するかどうかを判断できます。ただし通常は、検定のp値を使用して同じ決定を下すほうがより実用的で便利です。

p値

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

p値を使用して、中央値間の差のいずれかが統計的に有意かどうかを判定します。

中央値間の差のいずれかが統計的に有意かどうかを判断するために、p値を有意水準と比較し、帰無仮説を評価します。帰無仮説では母集団の中央値がすべて等しくなります。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には差が存在しない場合に、差が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:いくつかの中央値間の差は統計的に有意です
p値が有意水準以下の場合は、帰無仮説を棄却し、母集団のすべての中央値が等しいとは限らないと結論付けます。専門知識を使用して、差が実質的に有意かどうかを判定します。 詳細は統計的有意性と実質的有意性を参照してください。
p値 > α:中間値の間の差は統計的に有意ではありません
p値が有意水準より大きい場合、母集団の中央値がすべて等しいという帰無仮説を棄却するのに十分な証拠は得られません。検定の検出力が、実質的に有意な差を検出するのに十分であることを検証します。詳細は仮説検定の検出力を高めるを参照してください。