在需要使用非正态数据进行假设检验时,可使用几个选项。
尽管许多假设检验在形式上基于正态假设,但是如果您的样本足够大,则仍可以在非正态数据中获得很好的结果。所需的数据量取决于您数据的非正态程度,但通常 20 个样本即足够。正态的强大性与样本大小之间的关系基于中心极限定理。该定理证明,随着样本大小增加,任何分布中数据均值的分布接近于正态分布。因此,如果您需要影响总体均值,则只要样本足够大,正态假设并不重要。
非参数检验不假设总体的特定分布。Minitab 提供一些非参数检验,可用于代替假设了正态性的检验。当您具有偏斜的小样本,或包含几个异常值的样本时,这些检验特别有用。
假设使用正态数据的检验 | 非参数检验等效 |
---|---|
单样本 Z、单样本 t | 单样本符号、单样本 Wilcoxon |
双样本 t | Mann-Whitney |
方差分析 | Kruskal-Wallis、Mood's median、Friedman |
非参数检验并不是完全不对数据做任何假设:例如,它们仍要求数据是独立的随机样本。
有时,您可以通过应用函数来变换数据以使数据符合正态分布,从而完成分析。