一批数字的中心的常用度量。均值又称为平均数。均值是由所有观测值之和除以(非缺失)观测值个数得来的。
项 | 说明 |
---|---|
xi | 第 i 个观测值 |
N | 非缺失观测值个数 |
样本标准差用来度量数据的散布。它等于样本方差的平方根。
项 | 说明 |
---|---|
x i | 第 i 个观测值 |
观测值的均值 | |
N | 非缺失观测值个数 |
A2 度量拟合线(基于所选分布)与非参数步骤函数(基于标绘点)之间的面积。统计量是在分布的尾部施加更大权重的平方距离。如果 Anderson-Darling 值较小,则表明分布与数据拟合得更好。
Anderson-Darling 正态性检验的定义如下:
H0:数据服从正态分布
H1:数据不服从正态分布
项 | 说明 |
---|---|
F(Yi) | ,即标准正态分布的累积分布函数 |
Yi | 排序数据 |
Ryan-Joiner 检验提供相关系数,相关系数指示数据和数据的正态评分之间的相关性。如果相关系数接近 1,则说明数据与正态概率图离得很近。如果相关系数小于相应的临界值,则将否定正态性原假设。
项 | 说明 |
---|---|
Yi | 排序观测值 |
bi | 排序数据的正态评分 |
s2 | 样本方差 |
项 | 说明 |
---|---|
D+ | maxi {i / n – Z (i)} |
D– | maxi {Z (i) – (i – 1) / n)} |
Z | F(X(i)) |
F(x) | 正态分布的概率分布函数 |
X(i) | 随机样本的第 i 个顺序统计量,1 ≤ i ≤ n |
n | 样本数量 |
P 值是另一个用来报告正态性检验结果的定量度量。如果 p 值较小,则表示原假设为假。
通常,点越接近拟合线,表明拟合得越好。Minitab 提供两种拟合优度度量来帮助评估分布与数据的拟合程度。
分布 | x 坐标 | y 坐标 |
---|---|---|
正态 | x | Φ–1 norm |
项 | 说明 |
---|---|
Φ–1 norm | 标准正态分布的逆 CDF 为 p 返回的值 |
输入数据绘制为 x 值。Minitab 计算发生概率而不进行分布假设。图上的 Y 刻度与正态分布论文中的 Y 刻度相似,在正态分布论文中,概率图绘制为一条直线,就好像数据来自正态分布一样。