1サンプル符号検定のすべての統計量を解釈する

1サンプル符号分析で使用されるすべての統計量の定義と解釈について解説します。

N

サンプルサイズ(N)は、サンプルに含まれる観測値の合計数です。

解釈

サンプルサイズは、信頼区間と検定の検出力に影響します。

通常、サンプルサイズが大きいほど信頼区間が狭くなります。また、サンプルサイズが大きいほど、検定での差の検出力が高くなります。詳細は、検出力とはを参照してください。

中央値

中央値はデータセットの中間点です。この中間点の値は、観測値の半分がその値より上にあり、観測値の半分がその値より下にあるという点です。中央値は、観測値に順位付けし、順位付けされた順序での順位が[N + 1] / 2の観測値を検出することによって算定されます。観測値の数が偶数の場合、その中央値は、N / 2と[N / 2] + 1の順位で順位付けされる観測値の平均値です。

解釈

サンプルデータの中央値は、母集団中央値の推定値です。

中央値は母集団全体ではなくサンプルデータに基づくため、サンプル中央値が母集団中央値に一致する可能性は低いと言えます。より良好に母集団中央値を推定するためには、信頼区間を使用します。

Minitabでは項目が一度に1つだけ計算されるため、信頼区間と検定結果の両方を得るには分析を2回実行する必要があります。

信頼区間(CI)

信頼区間は、母集団中央値の値が含まれる可能性が高い範囲です。データのサンプルはランダムであるため、2つの母集団サンプルの信頼区間が同一である可能性は低くなります。しかし、サンプルを何度も繰り返して測定すると、得られた信頼区間または限界値の特定の割合に未知の母集団中央値が含まれることになります。このような中央値を含む信頼区間や限界値の割合(%)を区間の信頼水準と言います。たとえば、95%の信頼水準は、母集団から100個のサンプルをランダムに採取した場合、そのうちおよそ95個からは母集団中央値を含む区間が得られると期待することができます。

上限は、母集団中央値がそれより小さくなる可能性が高い値です。下限は、母集団中央値がそれより大きくなる可能性が高い値です。

信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。

符号検定の統計量は離散するため、1サンプル符号検定では、指定した信頼水準が必ず達成されるとは限りません。このためMinitabでは、さまざまなレベルの精度で3つの信頼区間を計算します。達成された信頼水準が目標信頼水準に最も近くなる最短の区間を使用してください。
  • 最初の信頼区間の信頼水準は、指定する信頼水準未満の達成可能な最高水準です。その位置は、上限および下限としてMinitabで使用される観測値を示します。たとえば、位置が(7, 14)の場合、信頼区間は7番目に小さい観測値と14番目に小さい観測値の間です。
  • 2番目の信頼区間は、常に指定する信頼水準にあります。信頼区間の上限と下限はサンプルからの実際の観測値ではないため、位置はありません。Minitabではこの信頼区間の計算に非線形補間(NLI)が使用されます。
  • 3番目の信頼区間には、指定する信頼水準より大きい、達成可能な信頼水準が含まれます。これは通常、最も幅の広い区間です。

Minitabでは項目が一度に1つだけ計算されるため、信頼区間と検定結果の両方を得るには分析を2回実行する必要があります。

記述統計量

サンプルN中央値
クロム含有率1217.7

ηに対する95%信頼区間

サンプルηに信頼区間達成された信頼性位置
クロム含有率(17.5, 18.1)85.40%(4, 9)
  (17.4263, 18.7632)95.00%内挿
  (17.4, 19)96.14%(3, 10)

これらの結果では、クロム含有率の母集団中央値の推定値は17.7です。2番目の区間は目標の95%に最も近い信頼区間であるため、この区間を使用することができます。95%の信頼度で、母集団の中央値が17.43から18.76の間に含まれると考えることができます。

達成された信頼性

達成された信頼水準は、指定した信頼水準以下/以上の信頼水準です。達成された信頼水準は、母集団の中央値が信頼区間に含まれる確率を示します。たとえば、95%の信頼水準は、母集団から100個のサンプルをランダムに採取した場合、そのうちおよそ95個からは母集団中央値を含む区間が得られると期待することができます。

符号検定の統計量は離散するため、1サンプル符号検定では、指定した信頼水準が必ず達成されるとは限りません。このためMinitabでは、さまざまなレベルの精度で3つの信頼区間を計算します。達成された信頼水準が目標信頼水準に最も近くなる最短の区間を使用してください。
  • 最初の信頼区間の信頼水準は、指定する信頼水準未満の達成可能な最高水準です。その位置は、上限および下限としてMinitabで使用される観測値を示します。たとえば、位置が(7, 14)の場合、信頼区間は7番目に小さい観測値と14番目に小さい観測値の間です。
  • 2番目の信頼区間は、常に指定する信頼水準にあります。信頼区間の上限と下限はサンプルからの実際の観測値ではないため、位置はありません。Minitabではこの信頼区間の計算に非線形補間(NLI)が使用されます。
  • 3番目の信頼区間には、指定する信頼水準より大きい、達成可能な信頼水準が含まれます。これは通常、最も幅の広い区間です。

位置

位置はデータの順位(i)です。位置により、1番目と3番目の信頼区間の上限および下限としてMinitabが使用する観測値が示されます。たとえば、位置が(7、14)の場合、信頼区間は7番目に小さな観測値と14番目に小さな観測値の間になります。

2番目の区間の場合、Minitabは非線形内挿法を使用し、この場合は位置は不要です。

帰無仮説と対立仮説

帰無仮説と対立仮説は、ある母集団についての相互に排他的な2つの仮説です。仮説検定手法では、サンプルデータを用いて帰無仮説を棄却するかどうかを判断します。
帰無仮説
帰無仮説では母集団パラメータ(平均や標準偏差など)は仮説値に等しいと仮定します。帰無仮説とは多くの場合、前回の分析や専門知識を基にした最初の主張を指します。
対立仮説
対立仮説では、母集団パラメータは帰無仮説の仮説値よりも小さい、大きい、異なると仮定します。対立仮説とは、真であると確信できる、または真であることの証明が期待できる仮説を指します。

出力では、帰無仮説と対立仮説により、検定中央値として正しい値を入力したことを検証できます。

数 <

この値は、サンプルに含まれる、検定中央値よりも小さい値の数です。

解釈

Minitabでは、サンプルに含まれる、検定中央値より小さい値の数、中央値と等しい値の数、中央値より大きい値の数を使用してp値を計算します。通常、中央値より大きいかまたは小さい観測値の数の差が大きいほど、算出されるp値は小さくなります。Minitabでは、検定中央値と等しい観測値を除外し、p値を計算するために使用する観測値の数を、除外する観測値の数だけ減らします。

数 =

この値は、サンプルに含まれる、検定中央値と等しい値の数です。

解釈

Minitabでは、サンプルに含まれる、検定中央値より小さい値の数、中央値と等しい値の数、中央値より大きい値の数を使用してp値を計算します。通常、中央値より大きいかまたは小さい観測値の数の差が大きいほど、算出されるp値は小さくなります。Minitabでは、検定中央値と等しい観測値を除外し、p値を計算するために使用する観測値の数を、除外する観測値の数だけ減らします。

数 >

この値は、サンプルに含まれる、検定中央値よりも大きい値の数です。

解釈

Minitabでは、サンプルに含まれる、検定中央値より小さい、中央値と等しい、および中央値より大きい値の数を使用してp値を計算します。通常、中央値より大きいかまたは小さい観測値の数の差が大きいほど、算出されるp値は小さくなります。Minitabでは、検定中央値と等しい観測値を除外し、p値を計算するために使用する観測値の数を除外する観測値の数だけ減らします。

p値

p値は帰無仮説を棄却するための証拠を測定する確率です。p値が小さいほど、帰無仮説を棄却するための強力な証拠となります。

解釈

p値を使用して、母中央値が仮中央値と統計的に異なるかどうかを判断します。

母中央値と仮説中央値の差が統計的に有意かどうかを判断するには、p値を有意水準と比較します。通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。有意水準が0.05の場合は、実際には差がないのに差が存在すると結論付けるリスクが5%あることを示します。
p値 ≤ α: 中央値間の差は統計的に有意です(H0を棄却する)
p値が有意水準以下の場合は、帰無仮説を棄却する決定を下します。母中央値と仮説中央値の差は統計的に有意であると結論付けることができます。専門知識に基づいて、差が実際に有意かどうかを判断します。詳細は、統計的有意性と実質的有意性を参照してください。
p値 > α: 中央値間の差は有意に異なりません(H0を棄却しない)
p値が有意水準よりも大きい場合は、帰無仮説を棄却しない決定を下します。母中央値は仮説中央値と有意に異なると結論付けるだけの十分な証拠はありません。検定の検出力が、実質的に有意な差を検出するのに十分であることを確認してください。