例如,如果可疑异常值是样本中的最小数据,但是样本中还包括两个异常大的值,则 r12 作为检验统计量比较合适。当样本中仅包括一个极端值时,r10(又称为 Dixon Q)作为检验统计量比较合适。
在 Rorabacher (1991) 中,将 Dixon 检验统计量的临界值绘成了表格。
项 | 说明 |
---|---|
rij | Dixon 检验统计量(i = 1、2;j = 0、1、2) |
yi | 样本中的第 i 个最小值 |
n | 样本中的观测值个数 |
项 | 说明 |
---|---|
![]() | 样本均值 |
yi | 样本中的第 i 个最小值 |
s | 样本的标准差 |
n | 样本中的观测值个数 |
Minitab 使用 30 点 Gauss-Laguerre 求积计算内部积分。Minitab 使用 30 点 Gauss-Hermite 求积计算外部积分。
与 McBane (2006) 相似,Minitab 使用 16 点 Gauss-Legendre 求积方法计算 Fij(r)。
另外,King 观测到上述近似变成包含如下各项的等式:。
项 | 说明 |
---|---|
rij | Dixon 检验统计量,其中 i = 1、2;j = 0、1、2 |
yi | 样本中的第 i 个最小值 |
n | 样本中的观测值个数 |
W.J. Dixon (1951)。“Ratios Involving Extreme Values”(涉及极端值的比值),Annals of Mathematical Statistics(数理统计年刊),22(1),第 68 到 78 页。
E.P. KingKing (1953)。“On Some Procedures for the Rejection of Suspected Data”(针对一些否定可疑数据的过程),Journal of the American Statistical Association(美国统计协会杂志),第 48 卷第 263 期,第 531 到 533 页。
G.C. McBane (2006)。“Programs to Compute Distribution Functions and Critical Values for Extreme Value Ratios for Outlier Detection”(用来为异常值检测计算极端值比值的分布函数和临界值的程序),Journal of Statistical Software(统计软件杂志),第 16 卷第 3 期,第 1 到 9 页。
如果不成立,则计算得出的 p 值表示精确 p 值的上限。但是,上限是对精确 p 值的绝佳近似。
项 | 说明 |
---|---|
G | Grubbs 检验统计量 |
n | 样本中的观测值个数 |
T | 服从自由度为 n – 2 的 t 分布的随机变量 |