中央値はデータセットの中間点です。この中間点の値は、観測値の半分がその値より上にあり、観測値の半分がその値より下にあるという点です。中央値は、観測値に順位付けし、順位付けされた順序での順位[N + 1] / 2にある観測値を検出することによって算定されます。データに含まれる観測値の数が偶数の場合、その中央値は、N/2および[N/2] + 1の数で順位付けされた観測値の平均値です。
サンプル中央値は、各グループの母集団中央値の推定値です。全体の中央値は、すべての観測値の中央値です。
N>(全体の中央値より大きい)。これらの値は、全体の中央値よりも大きい各グループの観測値の数を表します。Minitabでは、N≤値とN>値の表を作成します。Minitabでは、これらの値を使用して関連性のカイ二乗検定を実行し、その検定でのp値を計算します。
グループにこのカテゴリの観測値が大量に含まれる場合は、グループの中央値は全体の中央値よりも大きくなる可能性が高くなります。
N≤(全体の中央値以下)は、全体の中央値以下の各グループに含まれる観測値の数です。Minitabでは、N≤値とN>値の表を作成します。Minitabでは、これらの値を使用して関連性のカイ二乗検定を実行し、その検定でのp値を計算します。
グループにこのカテゴリの観測値が大量に含まれる場合は、グループの中央値が全体の中央値よりも小さくなる可能性があります。
四分位間範囲(Q3~Q1)では、各グループに含まれるデータの広がりを測定します。この範囲は、75番目の百分位数(Q3)と25番目の百分位数(Q1)の間の距離です。
四分位間範囲に実質的な差がある場合は、そのグループに同じ広がりがないことを示します。この状態の場合、データは、グループの形状と広がりが同じであるとするMoodの中央値検定での仮定を満たさない場合があると考えられます。
信頼区間は、各母集団の真の中央値を含む可能性が高い値の幅です。
データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母集団パラメータが含まれることになります。このようなパラメータを含む信頼区間の割合(%)を区間の信頼水準と言います。
信頼区間を使用して、各グループの母集団中央値の推定値を評価します。
たとえば、信頼水準が95%の場合は、信頼区間にグループの中央値が含まれることを95%信頼できます。信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。
温度 | 中央値 | N <=全体の中央値 | N >全体の中央値 | Q3 – Q1 | 中央値の95%信頼区間 |
---|---|---|---|---|---|
38 | 19 | 4 | 3 | 4.00 | (17.4667, 22.5333) |
42 | 19 | 3 | 3 | 9.50 | (15.3571, 25.6429) |
46 | 22 | 2 | 4 | 7.25 | (15.7857, 26.5714) |
50 | 18 | 4 | 2 | 4.25 | (14.4286, 20.6429) |
全体 | 19 |
この区間は、温度38の中央値が19.0で、信頼区間がおよそ17.5から22.5の範囲になることを示します。
自由度(DF)は、データ内のグループ数から1を差し引いた数と等しくなります。帰無仮説では、カイ二乗分布により、指定した自由度で検定統計量の分布を近似します。Minitabでは、カイ二乗分布を使用してこの検定のp値を推定します。
カイ二乗統計量は、データにおけるグループ、およびグループの対応するN以上の値とN未満の値に基づくセルで構成される表から計算されます。Minitabでは、各セルの値を、1つのセルの観測値と期待値の間の差を二乗し、そのセルの期待値で除算して算出します。カイ二乗統計量は、これらの値の和です。
カイ二乗値が高いほど、観測値と期待値の間の差が大きいことを示します。 十分に大きなカイ二乗値は、中央値間の少なくとも1つの差が統計的に有意であることを示します。Minitabでは、カイ二乗分布とカイ二乗統計量を併用してp値を計算します。
そのカイ二乗統計量を使用して、帰無仮説を棄却するかどうかを判断できます。ただし通常は、検定のp値を使用して同じ決定を下すほうがより実用的で便利です。
p値は帰無仮説を棄却するための証拠を測定する確率です。確率が低いほど、帰無仮説を棄却する強力な証拠となります。
p値を使用して、中央値間の差のいずれかが統計的に有意かどうかを判定します。