ムードの中央値検定のすべての統計量を解釈する

Moodの中央値検定で使用されるすべての統計量の定義と解釈について解説します。

中央値

中央値はデータセットの中間点です。この中間点の値は、観測値の半分がその値より上にあり、観測値の半分がその値より下にあるという点です。中央値は、観測値に順位付けし、順位付けされた順序での順位[N + 1] / 2にある観測値を検出することによって算定されます。データに含まれる観測値の数が偶数の場合、その中央値は、N/2および[N/2] + 1の数で順位付けされた観測値の平均値です。

解釈

サンプル中央値は、各グループの母集団中央値の推定値です。全体の中央値は、すべての観測値の中央値です。

N:全体の中央値より大きい(N>)

N>(全体の中央値より大きい)。これらの値は、全体の中央値よりも大きい各グループの観測値の数を表します。Minitabでは、N≤値とN>値の表を作成します。Minitabでは、これらの値を使用して関連性のカイ二乗検定を実行し、その検定でのp値を計算します。

解釈

グループにこのカテゴリの観測値が大量に含まれる場合は、グループの中央値は全体の中央値よりも大きくなる可能性が高くなります。

全体の中央値よりN以下(N≤))検定での計算方法

N≤(全体の中央値以下)は、全体の中央値以下の各グループに含まれる観測値の数です。Minitabでは、N≤値とN>値の表を作成します。Minitabでは、これらの値を使用して関連性のカイ二乗検定を実行し、その検定でのp値を計算します。

解釈

グループにこのカテゴリの観測値が大量に含まれる場合は、グループの中央値が全体の中央値よりも小さくなる可能性があります。

四分位間範囲(Q3~Q1)

四分位間範囲(Q3~Q1)では、各グループに含まれるデータの広がりを測定します。この範囲は、75番目の百分位数(Q3)と25番目の百分位数(Q1)の間の距離です。

解釈

四分位間範囲に実質的な差がある場合は、そのグループに同じ広がりがないことを示します。この状態の場合、データは、グループの形状と広がりが同じであるとするMoodの中央値検定での仮定を満たさない場合があると考えられます。

信頼区間(95%の中央値の信頼区間)

信頼区間は、各母集団の真の中央値を含む可能性が高い値の幅です。

データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。

信頼区間は、次の2つの部分で構成されています。
点推定
点推定は、サンプルデータから算出されるパラメータの推定値です。信頼区間は、この値を中心にして得られます。ムードの中央値検定の場合、点推定は中央値の推定と同じです。
誤差幅
誤差幅は、信頼区間の幅を定義し、サンプル、サンプルサイズ、信頼水準において観測された変動性によって決定します。信頼区間の上限を計算するには、誤差幅を点推定に加算します。信頼区間の下限を計算するには、点推定から誤差幅を減算します。

解釈

信頼区間を使用して、各グループの母集団中央値の推定値を評価します。

たとえば、信頼水準が95%の場合は、信頼区間にグループの中央値が含まれることを95%信頼できます。信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。

記述統計量

温度中央値N <=全体の中央値N >全体の中央値Q3 – Q1中央値の95%信頼区間
3819434.00(17.4667, 22.5333)
4219339.50(15.3571, 25.6429)
4622247.25(15.7857, 26.5714)
5018424.25(14.4286, 20.6429)
全体19       

この区間は、温度38の中央値が19.0で、信頼区間がおよそ17.5から22.5の範囲になることを示します。

帰無仮説と対立仮説

帰無仮説と対立仮説は、ある母集団についての相互に排他的な2つの仮説です。仮説検定手法では、サンプルデータを用いて帰無仮説を棄却するかどうかを判断します。
帰無仮説
帰無仮説では母集団パラメータ(平均や標準偏差など)は仮説値に等しいと仮定します。帰無仮説とは多くの場合、前回の分析や専門知識を基にした最初の主張を指します。
対立仮説
対立仮説では、母集団パラメータは帰無仮説の仮説値よりも小さい、大きい、異なると仮定します。対立仮説とは、真であると確信できる、または真であることの証明が期待できる仮説を指します。

DF

自由度(DF)は、データ内のグループ数から1を差し引いた数と等しくなります。帰無仮説では、カイ二乗分布により、指定した自由度で検定統計量の分布を近似します。Minitabでは、カイ二乗分布を使用してこの検定のp値を推定します。

カイ二乗

カイ二乗統計量は、データにおけるグループ、およびグループの対応するN以上の値とN未満の値に基づくセルで構成される表から計算されます。Minitabでは、各セルの値を、1つのセルの観測値と期待値の間の差を二乗し、そのセルの期待値で除算して算出します。カイ二乗統計量は、これらの値の和です。

解釈

カイ二乗値が高いほど、観測値と期待値の間の差が大きいことを示します。 十分に大きなカイ二乗値は、中央値間の少なくとも1つの差が統計的に有意であることを示します。Minitabでは、カイ二乗分布とカイ二乗統計量を併用してp値を計算します。

そのカイ二乗統計量を使用して、帰無仮説を棄却するかどうかを判断できます。ただし通常は、検定のp値を使用して同じ決定を下すほうがより実用的で便利です。

p値

p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。

解釈

p値を使用して、中央値間の差のいずれかが統計的に有意かどうかを判定します。

中央値間の差のいずれかが統計的に有意かどうかを判断するために、p値を有意水準と比較し、帰無仮説を評価します。帰無仮説では母集団の中央値がすべて等しくなります。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。0.05の有意水準は、実際には差が存在しない場合に、差が存在すると結論付けてしまうリスクが5%であるということを示します。
p値 ≤ α:いくつかの中央値間の差は統計的に有意です
p値が有意水準以下の場合は、帰無仮説を棄却し、母集団のすべての中央値が等しいとは限らないと結論付けます。専門知識を使用して、差が実質的に有意かどうかを判定します。 詳細は統計的有意性と実質的有意性を参照してください。
p値 > α:中間値の間の差は統計的に有意ではありません
p値が有意水準より大きい場合、母集団の中央値がすべて等しいという帰無仮説を棄却するのに十分な証拠は得られません。検定の検出力が、実質的に有意な差を検出するのに十分であることを検証します。詳細は仮説検定の検出力を高めるを参照してください。