サンプルサイズ(N)は、サンプルに含まれる観測値の合計数です。
サンプルサイズは、信頼区間と検定の検出力に影響します。
通常、サンプルサイズが大きいほど信頼区間が狭くなります。また、サンプルサイズが大きいほど、検定での差の検出力が高くなります。詳細は、検出力とはを参照してください。
中央値はデータセットの中間点です。この中間点の値は、観測値の半分がその値より上にあり、観測値の半分がその値より下にあるという点です。中央値は、観測値に順位付けし、順位付けされた順序での順位が[N + 1] / 2の観測値を検出することによって算定されます。観測値の数が偶数の場合、その中央値は、N / 2と[N / 2] + 1の順位で順位付けされる観測値の平均値です。
各サンプルの中央値は、各サンプルの母集団中央値の推定値です。
差は、2つのサンプルの中央値間の差です。
差は母集団全体ではなくサンプルデータに基づくため、サンプル差が母集団差に一致する可能性は低いと言えます。より良好に母集団差を推定するためには、信頼区間を使用します。
信頼区間は、母集団の差の値が含まれる可能性が高い範囲です。データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間または限界値の特定の割合に未知の母集団差が含まれることになります。このような差を含む信頼区間や限界値の割合(%)を区間の信頼水準と言います。たとえば、95%の信頼水準は、母集団から100個のサンプルをランダムに採取した場合、そのうちおよそ95個からは母集団差を含む区間が得られると期待することができます。
上限は、母集団差がそれより小さくなる可能性が高い値です。下限は、母集団差がそれより大きくなる可能性が高い値です。
信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。
差 | 差に対する信頼区間 | 達成された信頼性 |
---|---|---|
-1.85 | (-3, -0.9) | 95.52% |
これらの結果では、2つのハイウェイで塗料が持続する月数の差に対する母集団中央値の推定値は-1.85です。95.52%の信頼度で、母集団中央値の差は-3.0から-0.9の間に含まれると考えることができます。
マン-ホイットニー統計量(W値)は、最初のサンプルの順位の合計です。
Mintabでは、マン-ホイットニー統計量を使用して、帰無仮説を棄却するための証拠を測定する確率を示すp値を計算します。
マン-ホイットニー統計量の解釈はサンプルサイズに応じて異なるため、p値を使用して検定について決定します。p値は、すべてのサンプルサイズで同じ意味を持ちます。
p値は帰無仮説を棄却するための証拠を測定する確率です。p値が小さいほど、帰無仮説を棄却するための強力な証拠となります。
p値を使用して、母中央値間の差が統計的に有意かどうかを判断します。
平均順位は、両方のサンプルに同じ値が含まれる場合に発生します。データに平均順位がある場合、Minitabには、平均順位に合わせて調整されたp値と未調整のp値が表示されます。調整されたp値は、通常、未調整のp値より正確です。ただし、未調整のp値は、特定のサンプルペアの場合に調整されたp値よりも必ず大きくなるため、より控えめな推定値となります。