图形汇总的方法和公式

请选择您所选的方法或公式。

关于本主题

Anderson-Darling 统计量 (A²)
Anderson-Darling 正态性检验的 p 值
N 非缺失 (N)
标准差 (StDev)
方差
偏度
峰度
均值

最小值
最大值
第一个四分位数 (Q1)
中位数
第三个四分位数 (Q3)
均值的置信区间
中位数的置信区间
标准差的置信区间

Anderson-Darling 统计量 (A²)

A² 度量拟合线（基于所选分布）与非参数步骤函数（基于标绘点）之间的面积。统计量是在分布的尾部施加更大权重的平方距离。如果 Anderson-Darling 值较小，则表明分布与数据拟合得更好。

Anderson-Darling 正态性检验的定义如下：

H₀：数据服从正态分布

H₁：数据不服从正态分布

公式

表示法

项	说明
F(Y_i)	，即标准正态分布的累积分布函数
Y_i	排序数据

Anderson-Darling 正态性检验的 p 值

P 值是用来报告 Anderson-Darling 正态性检验结果的定量度量。如果 p 值较小，则表示原假设为假。

如果您知道 A ²，则可以计算 p 值。

设

根据 A'²，将使用以下等式计算 p：

如果 13 > A'² > 0.600，则 p = exp(1.2937 - 5.709 * A'² + 0.0186(A'²)²)
如果 0.600 > A'² > 0.340，则 p = exp(0.9177 - 4.279 * A'² – 1.38(A'²)²)
如果 0.340 > A'² > 0.200，则 p = 1 – exp(–8.318 + 42.796 * A'² – 59.938(A'²)²)
如果 A'² < 0.200，则 p = 1 – exp(–13.436 + 101.14 * A'² – 223.73(A'²)²)

N 非缺失 (N)

样本中非缺失值的个数。

标准差 (StDev)

样本标准差用来度量数据的散布。它等于样本方差的平方根。

公式

如果列中包含 x ₁, x ₂,..., x _N，且均值为

，则样本的标准差为：

表示法

项	说明
x _i	第 i 个观测值
	观测值的均值
N	非缺失观测值个数

方差

方差度量数据围绕其均值的分散程度。方差等于标准差的平方。

公式

表示法

项	说明
x_i	第 i 个观测值
	观测值的均值
N	非缺失观测值个数

偏度

偏度用来度量不对称度。负值表示向左偏斜，正值表示向右偏斜。零值不一定表示对称。

公式

表示法

项	说明
x_i	第 i 个观测值
	观测值的均值
N	非缺失观测值个数
s	样本的标准差

峰度

峰度可用来度量某个分布与正态分布的差异程度。正值通常表示，相比于正态分布，该分布的波峰更陡。负值表示，相比于正态分布，该分布的波峰更平坦。

公式

表示法

项	说明
x_i	第 i 个观测值
	观测值的均值
N	非缺失观测值个数
s	样本的标准差

均值

一批数字的中心的常用度量。均值又称为平均数。均值是由所有观测值之和除以（非缺失）观测值个数得来的。

公式

表示法

项	说明
x_i	第 i 个观测值
N	非缺失观测值个数

最小值

数据集中的最小值。

最大值

数据集中的最大值。

第一个四分位数 (Q1)

25% 的样本观测值小于或等于第一个四分位数的值。因此，第一个四分位数又称为第 25 个百分位数。

公式

表示法

项	说明
是	w 的整数截断值
w
z	w 的已被截断的分数分量
x_j	样本数据列表中的第 j 个观测值，按从小到大的顺序排列

注意

当 w 是整数时，y = w、z = 0、Q1 = x_y。

中位数

样本中位数位于数据的中间：至少有一半的观测值小于或等于它，至少有一半的观测值大于或等于它。

假设您有一个包含 N 个值的列。要计算中位数，首先按照从小到大的顺序对数据值进行排序。如果 N 为奇数，则样本中位数是位于中间的值。如果 N 为偶数，则样本中位数是两个中间值的平均数。

例如，当 N = 5 且您有数据 x₁、x₂、x₃、x₄ 和 x₅ 时，中位数 = x₃。

当 N = 6 且您有排序数据 x₁、x₂、x₃、x₄、x₅ 和 x₆ 时：

其中 x₃ 和 x₄ 是第三个和第四个观测值。

第三个四分位数 (Q3)

75% 的样本观测值小于或等于第三个四分位数的值。因此，第三个四分位数又称为第 75 个百分位数。

公式

表示法

项	说明
是	w 的截断值
w
z	w 的已被截断的分数分量
x_j	样本数据列表中的第 j 个观测值，按从小到大的顺序排列

注意

当 w 是整数时，y = w、z = 0、Q3 = x_y。

均值的置信区间

公式

表示法

项	说明
	均值
s	样本的标准差
N	非缺失数字
t_{N, α}	自由度为 N – 1 的 t 分布在 1 – α / 2 处的逆累积概率；α = 1 – 置信水平/100

中位数的置信区间

Minitab 使用非线性差值来计算实际中位数的置信区间。¹此方法是适用于众多对称分布（包括正态分布、Cauchy 分布和统一分布）的绝佳近似。非对称分布的示例显示足够多的结果，这些结果始终比线性差值结果更准确。

标准差的置信区间

Minitab 为总体标准差 σ 计算 (1 – α) 100% 置信区间。置信区间对于数据服从正态分布这一假设非常敏感。即使稍微偏离正态性，也会生成会产生误解的置信区间。

公式

置信区间：

表示法

项	说明
s	标准差
N	非缺失数字
χ²_{N, α}	χ² 的逆累积概率，在 1 – α / 2 下自由度为 N；α = 1 – 置信水平 / 100

¹ T.P. Hettmansperger 和 S.J. Sheather (1986)。“Confidence Intervals Based on Interpolated Order Statistics”（基于差值顺序统计量的置信区间），Statistics and Probability Letters（统计和概率通讯），第 4 期，第 75 到 79 页。

图形汇总 的方法和公式