什么是非参数方法?

非参数检验是不要求总体的分布以特定参数为特征的假设检验。例如,许多假设检验都依赖于总体服从参数为 μ 和 σ 的正态分布的假定。非参数检验没有这一假设,因此当您的数据显著呈非正态分布并且不能进行变换时,这类检验就非常有用。

在参数统计量中,我们假定样本是从完全指定的分布提取的,这些分布以一个或多个要根据其做出推断的未知参数为特征。在非参数方法中,我们假定未指定样本的父分布,而且通常会对分布的中心做出推断。例如,参数统计量中的许多检验(如单样本 t 检验)是在数据来自具有未知均值的正态总体的假设下推导的。在非参数研究中,去除了正态假设。

当正态假设不成立且样本数量很小时,非参数方法非常有用。但是,非参数检验并不是完全不对数据做任何假定。例如,假定样本中的观测值是独立的且来自同一个分布至关重要。同时,在双样本设计中,需要假定分布形状和散步相同。

例如,薪金数据呈极度右偏斜,众多的人拿有限的薪金,而只有极少数人享受高薪待遇。您可以对这些数据进行非参数检验以回答以下问题:
  • 公司薪金中位数是否等于某个特定值?使用单样本符号检验。
  • 某银行城市支行的薪金中位数是否大于该银行农村支行的薪金中位数?使用 Mann-Whitney 或 Kruskal-Wallis 检验。
  • 农村、城市和郊区的银行支行之间的薪金中位数是否不一样?使用 Mood 中位数检验。
  • 在城市和农村支行中,受教育程度对薪金有何影响?使用 Friedman 检验。

非参数检验的限制

非参数检验具有以下限制:
  • 当正态假设成立时,非参数检验通常不如相应的参数检验强大。因此,如果数据来自正态分布,则否定原本不成立的原假设的可能性不大。
  • 非参数检验往往要求您修改假设。例如,大多数有关总体中心的非参数检验都是关于中位数的检验,而不是关于均值的检验。如果总体不对称,该检验不能回答相应的参数过程可以回答的相同问题。

备择参数检验

如果可以在使用参数过程或非参数过程之间选择,并且您相对确定满足参数过程的假设,则可以使用参数过程。如果样本数量足够大,则当总体不是正态分布时,也可以使用参数过程。

下面是非参数检验及其参数选择方案的列表。

非参数检验 备择参数检验
单样本符号检验 单样本 Z 检验、单样本 t 检验
单样本 Wilcoxon 检验 单样本 Z 检验、单样本 t 检验
Mann-Whitney 检验 双样本 t 检验
Kruskal-Wallis 检验 单因子方差分析
Mood 中位数检验 单因子方差分析
Friedman 检验 双因子方差分析