正态性检验 的方法和公式

请选择您所选的方法或公式。

均值

一批数字的中心的常用度量。均值又称为平均数。均值是由所有观测值之和除以(非缺失)观测值个数得来的。

公式

表示法

说明
xii 个观测值
N非缺失观测值个数

标准差 (StDev)

样本标准差用来度量数据的散布。它等于样本方差的平方根。

公式

如果列中包含 x 1, x 2,..., x N,且均值为 ,则样本的标准差为:

表示法

说明
x i i 个观测值
观测值的均值
N非缺失观测值个数

N

Minitab 显示样本中非缺失观测值的个数。

Anderson-Darling

A2 度量拟合线(基于所选分布)与非参数步骤函数(基于标绘点)之间的面积。统计量是在分布的尾部施加更大权重的平方距离。如果 Anderson-Darling 值较小,则表明分布与数据拟合得更好。

Anderson-Darling 正态性检验的定义如下:

H0:数据服从正态分布

H1:数据不服从正态分布

公式

P 值是另一个用来报告正态性检验结果的定量度量。如果 p 值较小,则表示原假设为假。

如果您知道 A 2则可以计算 p 值。设:
根据 A'2,将使用以下等式计算 p:
  • 如果 13 >A'2 > 0.600,则 p = exp(1.2937 - 5.709 *A'2 + 0.0186(A'22
  • 如果 0.600 >A'2 > 0.340,则 p = exp(0.9177 - 4.279 *A'2 – 1.38(A'22
  • 如果 0.340 >A'2 > 0.200,则 p = 1 – exp(–8.318 + 42.796 *A'2 – 59.938(A'22
  • 如果A'2 <0.200 then p = 1 – exp(–13.436 + 101.14 * A'2 – 223.73(A'22

表示法

说明
F(Yi),即标准正态分布的累积分布函数
Yi排序数据

Ryan-Joiner

Ryan-Joiner 检验提供了一个相关系数,表明你的数据与数据有序统计量的正态分数之间的相关性。如果相关系数接近 1,则说明数据与正态概率图离得很近。如果相关系数小于相应的临界值,则将否定正态性原假设。

公式

相关系数的计算公式如下:
序统计量的正态分数定义如下:
其中 n 为样本量, i 为有序观测值的秩。将平局观测分配为他们排名的平均值。例如,如果两个并列的观测值分别位于有序数据的第5和第6位,则分别赋予5.5的秩。
p值是通过校正因子计算的,校正因子取决于样本量(n)。使用与你显著水平对应的因子。例如,如果α = 0.05,则使用 cor05
如果 n ≥ 50
如果 n < 50
然后将相关系数与修正因子比较,以确定p值:
  • 如果 R> cor10,那么 p >0.10。
  • 如果 cor05 < Rpcor10,则:
  • 如果 cor01 < Rpcor05,则:
  • 如果 Rpcor01,则 p < 0.01.

表示法

说明
Yi排序观测值
bi序统计的正态分数
s 2样本方差
n样本数量
i有序数据的排名

Kolmogorov-Smirnov

公式

Kolmogorov-Smirnov 检验的定义如下所示:
  • H0:数据服从正态分布
  • H1:数据不服从正态分布
Kolmogorov-Smirnov 检验统计量的定义如下所示:

为了确定p值,Minitab使用一个调整后的统计量(d*),该统计量考虑了样本量(n)。

d* 与以下临界值比较以确定p值:

  • 如果 d* < 0.775,则 p >0.15。
  • 如果 0.775≤ d* < 0.819,则:
  • 如果 0.819≤ d* < 0.895,则:
  • 如果 0.895≤ d* < 0.995,则:
  • 如果 0.995≤ d* < 1.035,则:
  • 如果 d* ≥ 1.035,则 p < 0.01.

表示法

说明
D+maxi {i / nZ (i)}
Dmaxi {Z (i) – (i – 1) / n)}
ZF(X(i))
F(x)正态分布的概率分布函数
X(i)ith 随机样本的顺序统计,1 ≤ i ≤ n
n样本数量

标绘点

通常,点越接近拟合线,表明拟合得越好。Minitab 提供两种拟合优度度量来帮助评估分布与数据的拟合程度。

公式

下表显示了如何构造中间线:
分布 x 坐标 y 坐标
正态 x Φ–1 norm

表示法

说明
Φ–1 norm 标准正态分布的逆 CDF 为 p 返回的值

概率图

输入数据绘制为 x 值。Minitab 计算发生概率而不进行分布假设。图上的 Y 刻度与正态分布论文中的 Y 刻度相似,在正态分布论文中,概率图绘制为一条直线,就好像数据来自正态分布一样。