ノンパラメトリック法とは

ノンパラメトリック検定は、母集団の分布を特定のパラメータによって特徴付ける必要がない仮説検定です。たとえば、多くの仮説検定は、母集団がパラメータμとαによる正規分布に従うという仮定に依存しています。ノンパラメトリック検定では、このように仮定しないため、データが大きく正規分布から逸脱していて変換しにくい場合に便利な手法です。

パラメトリック統計量では、推測する1つ以上の不明なパラメータによって特徴付けられる完全に指定された分布からサンプルが抽出されると仮定します。ノンパラメトリック法では、サンプルの親分布が指定されていないと仮定し、多くの場合、分布の中心に関して推測を行います。たとえば、1サンプルt検定などのパラメトリック統計量での多くの検定は、平均値が不明な正規母集団からデータが抽出されると仮定して取得されます。ノンパラメトリック分析では、正規性の仮定が排除さます。

ノンパラメトリック法は、正規性の仮定が難しく、サンプルサイズが小さい場合に便利です。ただし、ノンパラメトリック検定は、データに関する仮定を全く必要としないわけではありません。たとえば、サンプルでの観測値が独立しており、同じ分布から抽出されると仮定することは極めて重要です。また、2サンプル計画では、形状と広がりが等しいと仮定する必要があります。

たとえば、右側に大きく歪んだ給与データがあり、多くの従業員の給与はささやかなもので、一部の人だけが多額の給与を受け取っているとします。このデータでノンパラメトリック検定を実行し、次の質問に対する回答を得ることができます。
  • この会社の給与の中央値は、特定の値と同等かどうか。1サンプル符号検定を使用します。
  • 都市部の銀行支店の給与の中央値は、地方支店での給与の中央値に比べて大きいかどうか。Mann-Whitney検定またはKruskal-Wallis検定を使用します。
  • 地方、都市部、および郊外にある銀行支店での給与の中央値は異なっているかどうか。Moodの中央値検定を使用します。
  • 地方と都市部の銀行支店では、教育水準がどのように給与に影響しているか。Friedman検定を使用します。

ノンパラメトリック検定の制限

ノンパラメトリック検定には次の制限があります。
  • ノンパラメトリック検定は通常、正規性の仮定が正しい場合、対応するパラメトリック検定よりも検出力が劣ります。したがって、データを正規分布から抽出する場合は、偽であっても帰無仮説が棄却さる確率が低くなります。
  • ノンパラメトリック検定では、仮説の修正が必要になることもよくあります。たとえば、母集団の中心に関係するノンパラメトリック検定のほとんどは、平均ではなく中央値に関する検定です。この検定では、母集団が対称ではない場合、対応するパラメトリック手法の場合と同じ質問に対する回答は得られません。

代替パラメトリック検定

パラメトリック手法かノンパラメトリック手法のどちらかを選択でき、相対的にパラメトリック手法の仮定が満たされていると判断できる場合は、パラメトリック手法を使用します。また、サンプルサイズが十分に大きい場合は、母集団が正規分布していなければパラメトリック手法を使用することもできます。

ノンパラメトリック検定とその代替パラメトリック検定のリストを次に示します。

ノンパラメトリック検定 代替パラメトリック検定
1サンプル符号検定 1サンプルZ検定、1サンプルt検定
1サンプルWilcoxon検定 1サンプルZ検定、1サンプルt検定
Mann-Whitney検定 2サンプルt検定
Kruskal-Wallis検定 一元配置分散分析(ANOVA)
Moodの中央値検定 一元配置分散分析(ANOVA)
Friedman検定 二元配置の分散分析